数据分析方法及装置、电子设备、存储介质与流程

文档序号:18197053发布日期:2019-07-17 05:55阅读:160来源:国知局
数据分析方法及装置、电子设备、存储介质与流程

本申请实施例涉及数据处理技术领域,尤其涉及一种数据分析方法及装置、电子设备、存储介质。



背景技术:

随着网络平台(如交通工具调度平台)的业务发展,网络平台上的用户量以及与每一用户对应的用户数据的维度都不断增长。目前,出现了针对网络平台上产生的大量用户数据作数据分析的需求,以给平台的业务发展提供数据支持。而随着数据量级的日渐庞大,导致数据分析过程所带来的计算量较大,甚至无法在可接受的时间内完成计算。



技术实现要素:

有鉴于此,本申请提供一种数据分析方法及装置、电子设备。

为实现上述目的,本申请提供的技术方案如下:

一种数据分析方法,包括:

获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

根据所述群定义规则和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种数据分析方法,包括:

获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

根据所述清单和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种数据分析装置,包括:

获得单元,用于获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

生成单元,用于根据所述群定义规则和所述数据分析目标生成待执行语句;

索引创建单元,用于基于设定索引方式对用户数据创建索引库;

查询单元,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种数据分析装置,包括:

获得单元,用于获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

生成单元,用于根据所述清单和所述数据分析目标生成待执行语句;

索引创建单元,用于基于设定索引方式对用户数据创建索引库;

查询单元,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种电子设备,包括:

处理器;

用于存储处理器可执行指令的存储器;

所述处理器被配置为:

获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

根据所述群定义规则和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种电子设备,包括:

处理器;

用于存储处理器可执行指令的存储器;

所述处理器被配置为:

获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

根据所述清单和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:

获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

根据所述群定义规则和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:

获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

根据所述清单和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

通过以上技术方案可以看出,通过将用户数据采用设定索引方式创建索引库,在需要针对用户数据进行数据分析时,可以根据待分析用户群对应的信息(如群定义规则或清单)和所述数据分析目标生成待执行语句,最终,基于所述索引库调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。由于基于索引库来实现数据分析,且数据分析过程是针对特定的用户群来进行的,可以降低数据分析过程的计算量,提高了数据分析效率。

附图说明

图1为根据一示例性实施例示出的一种数据分析方法的流程图;

图2为根据一示例性实施例示出的另一种数据分析方法的流程图;

图3为根据一示例性实施例示出的电子设备的结构;

图4为根据一示例性实施例示出的一种数据分析装置的框图。

具体实施方式

对于网络平台的用户,可将用户的每一用户属性定义为一个“维”(dimension),每个用户的用户数据可由多个“维”的数据来构成,每一“维”可对应于用户的一种用户属性。本文以通过网络实现对交通工具(如车辆)的调度的平台为例对本技术方案进行介绍。在交通工具调度平台的每一用户而言,用户属性可包括:性别、年龄、城市、消费类型、调度交通工具的频率、调度交通工具产生的费用等,每个用户属性对应着一个属性值,如,年龄:28,城市:北京。目前,出现了针对网络平台上产生的大量用户数据作多维数据分析的需求,并且希望在较短时间内完成多维分析过程。

图1为根据一示例性实施例示出的一种数据分析方法的流程图,该方法的执行主体可以为各类电子设备(如网络设备、用户设备、终端设备或其他类型的计算设备)。如图1所示,在一实施例中,该方法可以通过下述步骤101~步骤105来实现,其中:

在步骤101中,获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标。

通常,数据分析工作往往可以针对特定的用户群来进行,而不是针对网络平台上的全量用户。在一实施例中,在步骤101之前,所述方法还可以包括:

步骤102:创建用户群并存储用户群的群标识和群定义规则之间的对应关系,其中所述群定义规则包括至少一个用户属性对应的属性值。

在一实施例中,可以预先创建多个候选的用户群,并设定各个用户群所对应的群定义规则。以交通工具调度平台为例,若需要创建由北京地区的高消费类型的用户组成的用户群,则该用户群所对应的群定义规则为:城市=“北京”&消费类型=“高消费类型”。每个用户群可以对应一个群标识,如:用户群1、用户群2、用户群3。

在创建了用户群之后,可以通过如下过程来获得待分析用户群的群定义规则:

步骤10:接收输入的群标识。如,可以在用户界面上提供多个已创建的用户群的标识供数据分析者来选择,用户选择某个用户群之后,则输入该被选择用户群对应的群标识。

步骤20:根据用户群的群标识和群定义规则之间的对应关系,确定与输入的群标识对应的群定义规则。

数据分析目标决定了用户需要通过数据分析得到什么样的分析结果。在一实施例中,数据分析目标可以包括选定的至少一个用户属性、针对选定的用户属性的分析指标(如:订单数、订单金额等)、与所述分析指标对应的聚合(aggregations)方式(如:求最大值、求最小值、求平均值等)。举例来说,当前需要分别分析出某个待分析用户群在性别、年龄、调度交通工具的频次这三个维度上的用户分布情况,则所述数据分析目标可以包含选定的用户属性:“性别”、“年龄”、“调度交通工具的频次”,以及分析指标:用户分布情况。又例如,当前需要分析某个待分析用户群的平均订单数,则所述数据分析目标可以包含分析指标:订单数,以及聚合方式:平均。

在步骤103中,根据群定义规则和数据分析目标生成待执行语句。其中,生成的待执行语句可以为dsl(domainspecificlanguages,领域特定语言)语句。

在步骤104中,基于设定索引方式对用户数据创建索引库。

为实现数据分析的目的,需要通过设定索引方式创建索引库。在一实施例中,所属索引库可以为elasticsearch(文中简称为es)索引库。其中,es为一个可扩展的开源搜索引擎。在创建es索引库时,一个文档可以包含一个用户的在各个维度上的属性值。所述设定索引方式可以为倒排索引(invertedindex)构建方式。

在步骤105中,调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

其中,所述索引库可以包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。在一些实施例中,所述用户属性可以包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率、参与交通工具调度事件的次数。实际上,对于交通工具调度平台,用户属性还包括很多,在此不作一一列举。

可见,由于基于索引库来实现,且数据分析过程是针对特定的用户群来进行的,可以降低数据分析过程的计算量,提高了数据分析效率。

图2为根据一示例性实施例示出的另一种数据分析方法的流程图,该方法的执行主体可以为各类电子设备(如网络设备、用户设备、终端设备或其他类型的计算设备)。如图2所示,在一实施例中,该方法可以通过下述步骤201~步骤205来实现,其中:

在步骤201中,获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单可以包含若干用户标识。所述清单可以是人工填写的,也可以是根据相应的筛选规则选取一定数量的用户,并将这些用户的标识填入该清单中。

在步骤203中,根据所述清单和所述数据分析目标生成待执行语句。

在步骤204中,基于设定索引方式对用户数据创建索引库。

为实现数据分析的目的,需要通过设定索引方式创建索引库。在一实施例中,所属索引库可以为elasticsearch(文中简称为es)索引库。其中,es为一个可扩展的开源搜索引擎。在创建es索引库时,一个文档可以包含一个用户的在各个维度上的属性值。所述设定索引方式可以为倒排索引(invertedindex)构建方式。

在步骤205中,调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

其中,所述索引库可以包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。在一些实施例中,所述用户属性可以包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率、参与交通工具调度事件的次数。

在一实施例中,对于通过清单方式构建的用户群来说,可能会新增一个或多个用户属性,在新增加一个或多个用户属性后,则需要根据所述清单对elasticsearch索引库进行索引更新(即针对清单中各个用户对应的用户数据重新创建倒排索引)才能实现。

可见,由于基于elasticsearch索引库来实现,且数据分析过程是针对特定的用户群来进行的,可以降低了数据分析过程的计算量,提高了数据分析效率。

图3为根据一示例性实施例示出的电子设备的结构。如图3所示,在一实施例中,一种电子设备,可包括处理器、内部总线、网络接口、存储器(包括内存以及非易失性存储器),当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行。在一实施例中,所述处理器被配置为:

获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

根据所述群定义规则和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

在另一实施例中,所述处理器被配置为:

获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

根据所述清单和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。

如图4所示,还提供一种应用于电子设备上的数据分析装置,在一软件实施例中,一种数据分析装置可包括:

获得单元301,用于获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

生成单元302,用于根据所述群定义规则和所述数据分析目标生成待执行语句;

索引创建单元303,用于基于设定索引方式对用户数据创建索引库;

查询单元304,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

在一实施例中,所述索引库可以包括若干用户的用户数据,每一用户的用户数据包括多个与用户属性对应的属性值。

在一实施例中,所述用户属性可以包括以下一种或多种:用户性别、用户年龄、用户所在的地区、用户所属的消费类型、参与交通工具调度事件的频率、参与交通工具调度事件的次数。

可选地,所述装置还可包括:

群创建单元,用于创建用户群并存储用户群的群标识和群定义规则之间的对应关系,所述群定义规则包括至少一个用户属性对应的属性值;

则所述获得单元可以包括:

接收子单元,用于接收输入的群标识;

确定子单元,用于根据用户群的群标识和群定义规则之间的对应关系,确定与输入的群标识对应的群定义规则。

可选地,所述数据分析目标包括选定的至少一个用户属性、针对选定的用户属性的分析指标、与所述分析指标对应的聚合方式。

在另一软件实施例中,一种数据分析装置可包括:

获得单元301,用于获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

生成单元302,用于根据所述清单和所述数据分析目标生成待执行语句;

索引创建单元303,用于基于设定索引方式对用户数据创建索引库;

查询单元304,用于调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

可选地,所述装置还包括:索引更新单元,用于根据所述清单对所述elasticsearch索引库进行索引更新。

在一实施例中,还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:

获得待分析用户群的群定义规则以及针对所述待分析用户群的数据分析目标;

根据所述群定义规则和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

在又一实施例中,还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:

获得待分析用户群对应的清单以及针对所述待分析用户群的数据分析目标,所述清单包含若干用户标识;

根据所述清单和所述数据分析目标生成待执行语句;

基于设定索引方式对用户数据创建索引库;

调用所述索引库的查询接口并执行所述待执行语句,得到数据分析结果。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于计算机设备实施例、装置实施例、存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1