一种推送消息的到达量的统计方法和装置与流程

文档序号:17180272发布日期:2019-03-22 20:50阅读:376来源:国知局
一种推送消息的到达量的统计方法和装置与流程

本发明涉及互联网技术领域,特别是一种推送消息的到达量的统计方法、推送消息的到达量的统计装置、计算机存储介质以及计算设备。



背景技术:

随着移动互联网技术的飞速发展以及电子设备智能化的普及,互联网成为当今主流的信息传播平台之一,同时,消息推送也成为通过互联网进行信息传播的主要手段之一。消息推送通常由信息传播平台(例如具有消息推送功能的应用服务平台)将用户期望获取的信息(如即时通讯信息、新闻资讯、营销活动信息)等以消息的形式推送给用户,可以有效提高信息传播平台上用户的活跃度。

在消息推送服务中,每条消息都对应一个到达量。为了掌握推送服务的效果,同时,分析了解用户的喜好,以便进一步制定个性化的推送方案,需要统计各个时段(比如,每小时内)到达量的情况。现有技术中,通过周期性地(比如,每小时)去源数据库查询出该小时所有被推送消息的到达记录信息,并写入一个文件中。然后,逐条读取该文件中的信息,将读取的信息与统计数据库中的记录进行匹配查询,如果统计数据库中不存在与读取的信息对应的消息,则将该消息的信息入库,如果已存在,则进行计数加1的累加操作。但是,当推送服务大量使用时,一条广播消息可能被推送给几百万个用户,则该消息对应了几百万的到达量,那么,在进行统计时,需要进行几百万次的匹配查询和累加操作,这将占用大量的资源,严重影响程序的执行效率和数据库的性能。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的推送消息的到达量的统计方法、推送消息的到达量的统计装置、计算机存储介质以及计算设备。

根据本发明实施例的一方面,提供了一种推送消息的到达量的统计方法,包括:

对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型;

将所获取的到达记录信息逐行写入一文件中;

对所述文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数;

根据所述去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

可选地,对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,包括:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。

可选地,对所述文件中的到达记录信息进行去重和重复次数统计,包括:

利用linux的sort和uniq-c命令对所述文件中的到达记录信息进行去重和重复次数统计。

可选地,所述到达类型包括已接收、已展示或已点击。

可选地,所述目标终端上报的被推送消息的到达记录信息是从所述目标终端上的软件工具包sdk生成的对被推送消息的打点日志中提取的。

可选地,所述消息唯一标识是消息id。

根据本发明实施例的另一方面,还提供了一种推送消息的到达量的统计装置,包括:

查询模块,适于对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型;

写入模块,适于将所获取的到达记录信息逐行写入一文件中;

去重统计模块,适于对所述文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数;以及

保存模块,适于根据所述去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

可选地,所述查询模块还适于:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。

可选地,所述去重统计模块还适于:

利用linux的sort和uniq-c命令对所述文件中的到达记录信息进行去重和重复次数统计。

可选地,所述到达类型包括已接收、已展示或已点击。

可选地,所述目标终端上报的被推送消息的到达记录信息是从所述目标终端上的软件工具包sdk生成的对被推送消息的打点日志中提取的。

可选地,所述消息唯一标识是消息id。

根据本发明实施例的再一方面,还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行根据上文中任一项所述的推送消息的到达量的统计方法。

根据本发明实施例的又一方面,还提供了一种计算设备,包括:

处理器;以及

存储有计算机程序代码的存储器;

当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行根据上文中任一项所述的推送消息的到达量的统计方法。

本发明实施例提出的技术方案,首先对存储有被推送消息的到达记录信息的第一数据库(或称为源数据库)进行查询,获取在待统计时间段内上报的每一被推送消息的到达记录信息,并将所获取的到达记录信息逐行写入一文件中,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型。然后,对该文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。最后,根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库(或称为统计数据库)中,完成推送消息的到达量统计。通过在进行入库操作前,对被推送消息的到达记录信息进行去重处理和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。由于每条到达记录信息都对应一个消息唯一标识和一种到达类型,因此,到达记录信息的重复次数即可视为与该到达记录信息中的消息唯一标识对应的被推送消息的该到达类型的到达量。由此,在进行入库操作时,只需根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型以及该到达记录信息的重复次数存入统计数据库,避免了针对每一条到达记录信息在统计数据库中进行匹配查询并根据查询结果相应进行计数累加更新操作的步骤,大大节省了数据分析时间,减少了数据库的操作次数,从而有效地提高了程序的执行效率和统计速度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一实施例的推送消息的到达量的统计方法的流程图;

图2示出了根据本发明另一实施例的推送消息的到达量的统计方法的流程图;以及

图3示出了根据本发明一实施例的推送消息的到达量的统计装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

对于推送(push)服务中每条消息的到达量,目前采用的统计方法主要包括如下步骤:首先,从源数据库查询出统计时间段内的所有被推送消息的到达记录信息,并写入一个文件内;然后,逐条读取该文件中的到达记录信息,将读取的信息与统计数据库中的记录进行匹配查询,如果统计数据库中不存在与读取的信息对应的消息记录,则将该消息的到达信息入库并设到达量为1,如果已存在,则对到达量进行count=count+1的累加操作。

但是,发明人发现,当推送服务大量使用时,这种通过匹配查询进行累加的统计方法遭遇执行效率过低的瓶颈。比如,快视频推送一条广播消息至一百万个用户,则该消息对应了一百万的到达量,那么,在进行统计时,就需要对这条消息进行一百万次的匹配查询和count=count+1的累加操作,导致执行效率特别低,统计速度非常慢。

为解决上述技术问题,本发明实施例提出一种推送消息的到达量的统计方法。图1示出了根据本发明一实施例的推送消息的到达量的统计方法的流程图。参见图1,该方法可以包括以下步骤s102至步骤s108。

步骤s102,对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型。

步骤s104,将所获取的到达记录信息逐行写入一文件中。

步骤s106,对该文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。

步骤s108,根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

本发明实施例提出的推送消息的到达量的统计方法,通过在进行入库操作前,对被推送消息的到达记录信息进行去重处理和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。由于每条到达记录信息都对应一个消息唯一标识和一种到达类型,因此,到达记录信息的重复次数即可视为与该到达记录信息中的消息唯一标识对应的被推送消息的该到达类型的到达量。由此,在进行入库操作时,只需根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型以及该到达记录信息的重复次数存入统计数据库,避免了针对每一条到达记录信息在统计数据库中进行匹配查询并根据查询结果相应进行计数累加更新操作的步骤,大大节省了数据分析时间,减少了数据库的操作次数,从而有效地提高了程序的执行效率和统计速度。

上文步骤s102中提及的第一数据库(也可以称为源数据库)可以设置于目标终端上搭载的目标客户端的推送代理服务器上或者统计方的数据中心。目标终端可以是智能手机、平板电脑等终端设备,目标客户端可以是在终端设备上安装的app(应用程序)客户端等。

可选地,目标终端上报的被推送消息的到达记录信息是从目标终端上的软件工具包(softwaredevelopmentkit,sdk)生成的对被推送消息的打点日志中提取的。打点是指由用户操作,引起视图变化,因此,打点记录的不仅仅是用户的操作行为,还记录视图变化时的业务数据信息。本发明实施例中,利用sdk监测目标终端侧对被推送消息的打点事件,例如,目标客户端接收到一被推送消息、接收到的被推送消息被展示到终端设备操作系统的通知栏、用户点击了接收到的被推送消息等。当sdk监测到对被推送消息的打点事件时,生成与该打点事件相应的打点日志,以记录被推送消息的到达记录信息,并进而将生成的打点日志上报至预先指定的服务器端或数据中心。

在每条被推送消息的到达记录信息中,包括上报时间、消息唯一标识和到达类型。其中,消息唯一标识可以是消息名、消息id等。

在一个可选实施例中,根据被推送消息的类型和用户的操作的不同,被推送消息的到达类型可以包括已接收、已展示或已点击。具体地,已接收是指目标客户端已接收到被推送消息但并未显示该消息,例如,接收到应用内消息或者服务器端发送给app客户端的不需要显示的消息。已展示是指被推送消息已展示到目标终端设备的操作系统的通知栏中。已点击是指目标客户端接收到的被推送消息已被用户点击进行查看。

在一个可选实施例中,步骤s102中对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,还可以具体地实施为:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。此处提及的指定周期可以根据实际统计需求进行设定,例如设定为1小时、2小时等。通过周期性获取被推送消息的到达记录信息进行统计,可以掌握各时段(比如,每小时内)到达量的情况,以便进一步分析了解用户的喜好,制定个性化的推送方案。

在实际操作中,基于到达记录信息数据的特点,可以采用hive工具进行源数据库的构建以及查询,从而提高到达记录信息的存储和查询效率。hive是一款构建于hadoop之上的数据仓库工具,对外提供hql(类sql)接口,底层借助mapreduce或者spark分析存储在hdfs上的大规模数据集。此外,hive也能分析其他存储系统中的数据,例如hbase、rdb、mongodb等。hive的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。

在获取到在指定时间段内上报的每一被推送消息的到达记录信息后,执行步骤s104,将所获取的到达记录信息逐行写入一文件中,以待后续处理。

下面以示例方式列出了文件中写入的多条到达记录信息:

以上示例的多条到达记录信息中,第一列为上报时间,其中,根据统计的时间精度设置上报时间的单位。在本例中,将上报时间的单位设为小时,具体地,2018022211表示2018-02-22第11小时。第二列为到达类型,其中,received表示已接收,displayed表示已展示,clicked表示已点击。第三列包含消息唯一标识,本例中以messageid表示,sourcetype表示打点信息的来源通道。

从以上示例可以看出,例如对于messageid为7274832258019387426的消息,具有三条相同的received类型的到达记录信息,表明在2018022211时段内该消息已被3个目标终端接收,即已接收类型的到达量为3。同时对于该消息,还具有一条clicked类型的到达记录信息,表明在2018022211时段内该消息已在1个目标终端上被点击,即已点击类型的到达量为1。

基于上述认识,本发明实施例在步骤s106中对文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。

在一个可选实施例中,利用linux的sort和uniq-c命令对该文件中的到达记录信息进行去重和重复次数统计。具体地,通过sort命令对文件中的多行到达记录信息进行排序,使重复行集中到一起。然后,通过uniq-c命令去除重复行并统计重复次数。

仍以上面的多条到达记录信息为例,在进行去重和重复次数统计处理后,得到的结果如下所示:

以上结果中,每一行中的第一列即为该行到达记录信息的重复次数,也就是,与该行到达记录信息中的messageid对应的被推送消息在该行到达记录信息所记录的到达类型下的到达量。

在上文步骤s108中,在得到去重后的到达记录信息及其相应的重复次数之后,根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库(也可以称为统计数据库)中。

下面仍以上述多条到达记录信息为例进行说明。例如,对于messageid:7274832258019387426,根据该messageid,将与messageid:7274832258019387426对应的第一条到达记录信息中的到达类型received(已接收)和该到达记录信息的重复次数3(作为与该messageid对应的被推送消息的已接收类型的到达量),以及与messageid:7274832258019387426对应的第二条到达记录信息中的到达类型clicked(已点击)和该到达记录信息的重复次数1(作为与该messageid对应的被推送消息的已点击类型的到达量)关联地存入第二数据库中。

在实际应用中,第二数据库可以采用mysql数据库。mysql是最流行的关系型数据库管理系统,其通过关联数据库将数据保存在不同的表中,从而增加了处理速度和管理灵活性。

以上介绍了图1所示实施例的各个环节的多种实现方式,下面将通过具体实施例来详细介绍本发明的推送消息的到达量的统计方法的实现过程。图2示出了根据本发明又一实施例的推送消息的到达量的统计方法的流程图。参见图2,该方法至少可以包括步骤s202至步骤s208。

步骤s202,每隔指定周期通过hive工具对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息id和到达类型。

本实施例中,指定周期设为1小时。被推送消息的到达类型包括已接收、已展示或已点击。

步骤s204,将所获取的到达记录信息逐行写入一文件中。

步骤s206,利用linux的sort和uniq-c命令对该文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。

步骤s208,根据去重后的到达记录信息中的消息id,将与各个消息id对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息id对应的被推送消息的该到达类型的到达量,关联地存入mysql数据库中。

需要说明的是,实际应用中,上述所有可选实施方式可以采用结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。

基于同一发明构思,本发明实施例还提供了一种推送消息的到达量的统计装置,用于支持上述任意一个实施例或其组合所提供的推送消息的到达量的统计方法。图3示出了根据本发明一实施例的推送消息的到达量的统计装置的结构示意图。参见图3,该装置至少可以包括:查询模块310、写入模块320、去重统计模块330和保存模块340。

现介绍本发明实施例的推送消息的到达量的统计装置的各组成或器件的功能以及各部分间的连接关系:

查询模块310,适于对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型。

写入模块320,与查询模块310连接,适于将所获取的到达记录信息逐行写入一文件中。

去重统计模块330,与写入模块320连接,适于对该文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。

保存模块340,与去重统计模块330连接,适于根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

在一个可选实施例中,查询模块310还适于:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。

在一个可选实施例中,去重统计模块330还适于:

利用linux的sort和uniq-c命令对该文件中的到达记录信息进行去重和重复次数统计。

在一个可选实施例中,被推送消息的到达类型可以包括已接收、已展示或已点击。

在一个可选实施例中,目标终端上报的被推送消息的到达记录信息可以是从目标终端上的软件工具包sdk生成的对被推送消息的打点日志中提取的。

在一个可选实施例中,被推送消息的消息唯一标识可以是消息id。

基于同一发明构思,本发明实施例还提供了一种计算机存储介质。该计算机存储介质存储有计算机程序代码,当该计算机程序代码在计算设备上运行时,导致计算设备执行根据上述任意一个实施例或其组合所述的推送消息的到达量的统计方法。

基于同一发明构思,本发明实施例还提供了一种计算设备。该计算设备可以包括:

处理器;以及

存储有计算机程序代码的存储器;

当该计算机程序代码被处理器运行时,导致该计算设备执行根据上述任意一个实施例或其组合所述的推送消息的到达量的统计方法。

根据上述任意一个可选实施例或多个可选实施例的组合,本发明实施例能够达到如下有益效果:

本发明实施例提出的推送消息的到达量的统计方法和装置,首先对存储有被推送消息的到达记录信息的第一数据库(或称为源数据库)进行查询,获取在待统计时间段内上报的每一被推送消息的到达记录信息,并将所获取的到达记录信息逐行写入一文件中,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型。然后,对该文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。最后,根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库(或称为统计数据库)中,完成推送消息的到达量统计。通过在进行入库操作前,对被推送消息的到达记录信息进行去重处理和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数。由于每条到达记录信息都对应一个消息唯一标识和一种到达类型,因此,到达记录信息的重复次数即可视为与该到达记录信息中的消息唯一标识对应的被推送消息的该到达类型的到达量。由此,在进行入库操作时,只需根据去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型以及该到达记录信息的重复次数存入统计数据库,避免了针对每一条到达记录信息在统计数据库中进行匹配查询并根据查询结果相应进行计数累加更新操作的步骤,大大节省了数据分析时间,减少了数据库的操作次数,从而有效地提高了程序的执行效率和统计速度。

所属领域的技术人员可以清楚地了解到,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。

另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。

本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom)、随机存取存储器(ram),磁碟或者光盘等各种可以存储程序代码的介质。

或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。

根据本发明实施例的一方面,提供了a1.一种推送消息的到达量的统计方法,包括:

对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型;

将所获取的到达记录信息逐行写入一文件中;

对所述文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数;

根据所述去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

a2.根据a1所述的方法,其中,对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,包括:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。

a3.根据a1或a2所述的方法,其中,对所述文件中的到达记录信息进行去重和重复次数统计,包括:

利用linux的sort和uniq-c命令对所述文件中的到达记录信息进行去重和重复次数统计。

a4.根据a1-a3中任一项所述的方法,其中,所述到达类型包括已接收、已展示或已点击。

a5.根据a1-a4中任一项所述的方法,其中,所述目标终端上报的被推送消息的到达记录信息是从所述目标终端上的软件工具包sdk生成的对被推送消息的打点日志中提取的。

a6.根据a1-a5中任一项所述的方法,其中,所述消息唯一标识是消息id。

根据本发明实施例的另一方面,还提供了b7.一种推送消息的到达量的统计装置,包括:

查询模块,适于对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在指定时间段内上报的每一被推送消息的到达记录信息,其中,每条到达记录信息包括上报时间、消息唯一标识和到达类型;

写入模块,适于将所获取的到达记录信息逐行写入一文件中;

去重统计模块,适于对所述文件中的到达记录信息进行去重和重复次数统计处理,得到去重后的到达记录信息及其相应的重复次数;以及

保存模块,适于根据所述去重后的到达记录信息中的消息唯一标识,将与各个消息唯一标识对应的到达记录信息中的到达类型,以及该到达记录信息的重复次数作为与该消息唯一标识对应的被推送消息的该到达类型的到达量,存入第二数据库中。

b8.根据b7所述的装置,其中,所述查询模块还适于:

每隔指定周期对存储有目标终端上报的被推送消息的到达记录信息的第一数据库进行查询,获取在上一个周期内上报的每一被推送消息的到达记录信息。

b9.根据b7或b8所述的装置,其中,所述去重统计模块还适于:

利用linux的sort和uniq-c命令对所述文件中的到达记录信息进行去重和重复次数统计。

b10.根据b7-b9中任一项所述的装置,其中,所述到达类型包括已接收、已展示或已点击。

b11.根据b7-b10中任一项所述的装置,其中,所述目标终端上报的被推送消息的到达记录信息是从所述目标终端上的软件工具包sdk生成的对被推送消息的打点日志中提取的。

b12.根据b7-b11中任一项所述的装置,其中,所述消息唯一标识是消息id。

根据本发明实施例的又一方面,还提供了c13.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行根据a1-a6中任一项所述的推送消息的到达量的统计方法。

根据本发明实施例的再一方面,还提供了d14.一种计算设备,包括:

处理器;以及

存储有计算机程序代码的存储器;

当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行根据a1-a6中任一项所述的推送消息的到达量的统计方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1