一种采集用户行为数据的方法及装置与流程

文档序号:11063867阅读:752来源:国知局
一种采集用户行为数据的方法及装置与制造工艺

本发明涉及数据采集领域,尤其是一种采集用户行为数据的方法及装置。



背景技术:

用户行为数据是用户访问网站所产生的信息。通过用户行为数据可以挖掘出用户访问行为、相似用户群体、频繁访问路径和内容等有价值的信息。采集并分析用户行为数据可以让企业更加详细、清楚地了解用户的行为习惯,从而找出网站、推广渠道等企业营销环境存在的问题,有助于企业发掘高转化率页面,让企业的营销更加精准、有效,提高业务转化率,从而提升企业的广告收益。

现有采集用户行为数据的方式为:将采集SDK(Software Development Kit,软件开发工具包)嵌入到客户端的APP或者网络侧的网站上,采集SDK把所有采集到的数据发送给用于数据分析的服务器。目前,采集SDK会将APP或网站侧产生的所有用户行为数据全部进行采集和回传,但是实际应用中,数据分析过程并不会使用到所有的用户行为数据,因此SDK会向服务器发送大量的冗余信息,增加了带宽与存储的压力。



技术实现要素:

本发明提供了一种采集用户行为数据的方法及装置,能够解决回传冗余信息导致的增加带宽与存储压力的问题。

为了解决或部分解决上述技术问题,一方面,本发明提供了一种采集用户行为数据的方法,包括:

在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,所述配置文件用于限定用户行为数据的采集条件;

执行所述配置文件,读取其中的配置项;

采集对应所述配置项的用户行为数据;

将采集的用户行为数据发送给数据分析工具。

另一方面,本发明还提供了一种采集用户行为数据的装置,包括:

加载单元,用于在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,所述配置文件用于限定用户行为数据的采集条件;

执行单元,用于执行所述加载单元加载的配置文件,读取其中的配置项;

采集单元,用于采集对应所述执行单元读取的配置项的用户行为数据;

发送单元,用于将所述采集单元采集的用户行为数据发送给数据分析工具。

本发明提供的采集用户行为数据的方法及装置,能够在采集软件开发工具包SDK程序启动时,加载用于限定用户行为数据采集条件的配置文件,执行并读取配置文件中的配置项,采集与配置项对应的用户行为数据,将采集的用户行为数据发送给数据分析工具。与现有技术相比,本发明通过配置文件限定用户行为数据采集条件,采集部分用户行为数据。通过配置文件,有选择的采集用户行为数据,剔除用户行为数据中的冗余信息,减少信息的采集量,从而减少发送给数据分析工具的数据量,降低带宽与存储的压力。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种采集用户行为数据的方法流程图;

图2示出了本发明实施例提供的另一种采集用户行为数据的方法流程图;

图3示出了本发明实施例提供的一种采集用户行为数据的装置的组成框图;

图4示出了本发明实施例提供的一种采集用户行为数据的装置组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种采集用户行为数据的方法,如图1所示,该方法包括:

101、在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,配置文件用于限定用户行为数据的采集条件。

所述SDK,是指软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。软件开发工具包还包括示例代码、支持性的技术注解或其他的为基本参考资料澄清疑点的支持文档。所述采集SDK,是指具有采集用户行为数据功能的软件开发工具包。

所述程序启动,是指采集SDK功能的开启,即开始准备采集用户行为数据。采集SDK是嵌入客户端的APP或者网络侧的网站上的,根据客户端的APP或者网络侧的网站开发者的设置不同,采集SDK的启动方式也不相同。采集SDK的启动方式,可以是打开客户端或网站时自动启动采集SDK,也可以是在客户端APP或网站上设置触发机制,当满足触发条件时,启动采集SDK。在本实施例中,对采集SDK的启动方式不做限制。

加载数据采集使用的配置文件,是指启动采集SDK时配置文件的载入,将配置文件调入内存中,以便采集SDK读取配置文件。

所述配置文件,包括了限定用户行为数据的采集条件。根据配置文件中的采集条件,选择性的采集用户行为数据。通过配置文件控制用户行为数据的采集。

所述采集条件,是指对用户行为数据采集类型的限定条件。采集的条件的确定,可以是开发者根据普遍需求确定,可以是根据客户采集用户行 为数据的目的确定的,也可以是由需要用户行为数据的客户确定的。示例性的,对于某网站,若客户为了统计使用者的联网方式,则在采集条件中一定要有关于联网方式的信息;若客户为了统计使用者是否有地区差,则在采集条件中一定要有网络登录的IP地址。

102、执行配置文件,读取其中的配置项。

所述执行所述配置文件,是指采集SDK对已经加载到内存的配置文件的执行操作。

所述配置项,是指配置文件中采集用户行为数据的具体条件。本实施例中,配置项以程序代码的形式记录于配置文件中,通过对配置文件的执行读取配置项。本实施例中不对配置项的类型与数量进行限制。

103、采集对应配置项的用户行为数据。

根据配置文件中配置项所限定的条件,采集对应的用户行为数据。示例性的,对于某一需要采集用户行为数据的网站,在配置文件中分别设置了对应网站名称、访问时间、页面停留时间以及网页响应时间等多个配置项,那么在用户行为数据采集时,需要按照各个配置项采集网站名称、访问时间、页面停留时间以及网页响应时间等用户行为数据。像用户IP地址这样的通常需要采集的而没有设置对应配置项的用户行为数据则不予采集。

104、将采集的用户行为数据发送给数据分析工具。

在完成数据采集后,将采集的数据发送给数据分析工具进行处理。由于步骤103是按照配置项的要求进行采集,采集内容不包括数据分析不需要的其他冗余信息,因此本步骤中发送的用户行为数据中也不会包含不必要的冗余信息。

本实施例提供的采集用户行为数据的方法,能够在采集软件开发工具包SDK程序启动时,加载用于限定用户行为数据采集条件的配置文件,执行并读取配置文件中的配置项,采集与配置项对应的用户行为数据,将采集的用户行为数据发送给数据分析工具。与现有技术相比,本实施例通过配置文件限定用户行为数据采集条件,采集部分用户行为数据。通过配置文件,有选择的采集用户行为数据,剔除用户行为数据中的冗余信息,减 少信息的采集量,从而减少发送给数据分析工具的数据量,降低带宽与存储的压力。

进一步的,作为图1的细化和扩展,本发明另一实施例还提供了一种采集用户行为数据的方法,如图2所示,该方法包括:

201、在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,配置文件用于限定用户行为数据的采集条件。

本实施例中,配置文件为可扩展标记语言XML(eXtensible Markup Language,可扩展标记语言)结构的配置文件,实际应用中配置文件的结构还包括但不限于是:INI、Nginx。

当数据分析需求发生变化时,用于限定用户行为数据的采集条件通常也会发生变化,这样就需要修改对应的配置文件,以获得新的配置文件。

配置文件可以由采集SDK的开发者通过修改编程代码修改,也可以由采集SDK的开发者开发的用于生成配置文件的人机交互界面修改。通过人机交互界面修改配置文件的方式,可以由采集SDK的开发者操作,也可以由采集SDK的客户操作。在本实施例中对配置文件的修改方式不做限定。

人机交互界面中,对于配置项的修改,可以通过采集SDK开发者给出的配置项进行勾选,也可以自由编写。在本实施例中,对配置项的增减方式不做限定。

202、通过SDK程序对配置文件进行解析,查找解析后配置文件中的配置项。

执行所述配置文件,是通过SDK程序对配置文件进行解析,在解析后配置文件中查找预设的配置标签,读取配置标签对应的配置项。本实施例中的配置标签用于使计算机对配置项进行识别,一般情况下,配置标签的内容不具有实质含义。示例性的,在配置文件中一段程序代码如下:

<config>

<arguments>

<argument1>item1</argument1>

<argument2>item2</argument2>

<argument3>item3</argument3>

<arguments>

<config>

其中,arguments为配置文件中的配置标签,包括位于配置项前面并与配置项相邻的开始标签,以及位于配置项后面并与配置项相邻的结束标签。在解析配置文件时,在配置文件中查找预设的配置标签argument1、argument2和argument3,根据XML文件格式的开始标签与结束标签的标识,分别读取配置标签对应的配置项item1、item2和item3。

203、查找对应配置项的采集函数,采集函数用于采集对应配置项的用户行为数据。

用户行为数据的采集通过采集函数来实现,采集函数与配置项对应,一个配置项对应一个采集函数。

根据步骤202读取的配置项,查找对应配置项的采集函数,执行查找到的采集函数,以对该配置项对应的用户行为数据进行定向采集。

204、将采集的用户行为数据发送给数据分析工具。

本步骤的实现方式与图1步骤104的实现方式相同,此处不再赘述。

下面通过一个示例对图2所示方法进行说明。在该示例中,客户开发了一款APP,客户需要统计该APP的使用情况以便该款APP的升级更新。客户通过下载源、下载量、用户单次在线时长、联网方式及用户反馈信息,这五种用户行为数据作为该款APP升级更新的依据。这五种用户行为数据作为配置文件中配置项的内容,即配置文件中有五个配置项,分别为下载源、下载量、用户单次在线时长、联网方式及用户反馈信息。根据配置项的内容,设置各个配置项对应的配置标签为source、amount、period、networking、feedback,编写配置文件。在该APP启动时,开启采集SDK,加载编写好的配置文件。根据采集SDK编写的函数,查找配置文件中配置项的标签,并获取配置项对应的用户行为数据,完成用户行为数据的采集。最后将采集到的用户行为数据发送给数据分析工具。若客户升级更新该APP后,客户还需要了解该APP的用户更新情况,则将用户是否更新作为一个新的配置项,以update为配置标签,添加到配置文件中,生成新的配置文件。再根据新的配置文件,采集用户行为数据。

进一步的,作为对上述图1与图2所示方法的实现,本发明另一实施例还提供了一种采集用户行为数据的装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:加载单元31、执行单元32、采集单元33以及发送单元34,其中,

加载单元31,用于在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,配置文件用于限定用户行为数据的采集条件;

执行单元32,用于执行加载单元31加载的配置文件,读取其中的配置项;

采集单元33,用于采集对应执行单元32读取的配置项的用户行为数据;

发送单元34,用于将采集单元33采集的用户行为数据发送给数据分析工具。

进一步的,执行单元32,用于:

通过SDK程序对配置文件进行解析,查找解析后配置文件中的配置项。

进一步的,如图4所示,执行单元32,包括:

第一查找模块321,用于在解析后配置文件中查找预设的配置标签;

读取模块322,用于读取第一查找模块321查找到的配置标签对应的配置项。

进一步的,如图4所示,采集单元33,包括:

第二查找模块331,用于查找对应配置项的采集函数,采集函数用于采集对应配置项的用户行为数据;

执行模块332,用于执行第二查找模块331查找到的采集函数。

进一步的,加载单元31加载的配置文件为可扩展标记语言XML结构的配置文件。

本实施例提供的采集用户行为数据的装置,能够在采集软件开发工具包SDK程序启动时,加载用于限定用户行为数据采集条件的配置文件,执行并读取配置文件中的配置项,采集与配置项对应的用户行为数据,将采集的用户行为数据发送给数据分析工具。与现有技术相比,本实施例通过 配置文件限定用户行为数据采集条件,采集部分用户行为数据。通过配置文件,有选择的采集用户行为数据,剔除用户行为数据中的冗余信息,减少信息的采集量,从而减少发送给数据分析工具的数据量,降低带宽与存储的压力。

所述采集用户行为数据的装置包括处理器和存储器,上述加载单元31、执行单元32、采集单元33和发送单元34等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决回传冗余信息导致的增加带宽与存储压力的问题。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:在采集软件开发工具包SDK的程序启动时,加载数据采集使用的配置文件,所述配置文件用于限定用户行为数据的采集条件;执行所述配置文件,读取其中的配置项;采集对应所述配置项的用户行为数据;将采集的用户行为数据发送给数据分析工具。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、 专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1