一种推送信息的方法及装置与流程

文档序号:12121591阅读:161来源:国知局
一种推送信息的方法及装置与流程

本发明涉及计算机技术领域,尤其涉及一种推送信息的方法及装置。



背景技术:

随着互联网行业的飞速发展,数据量和数据类型也随之急剧增加,如何在海量数据中,挖掘有效信息,并合理、稳定的推荐给用户,也是目前互联网行业研究的热点、难点之一。

当前,对信息的推荐较常采用的方法是:将最近一段时间内搜索浏览的次数较多的信息作为热点信息,并推送所述热点信息。

然而,采用现有的推荐方法,存在较多的无效推送问题,例如,即使有较多用户已经浏览过某条信息了,但由于该信息的浏览次数大,为热点信息,还会无效的反复的推送给用户。再例如,当某条新闻信息很会将已经出现过多天的,不再具有可阅性时,仍然将该信息推送给用户。

可见,现有技术中的信息推送,存在无效推送率高的技术问题。



技术实现要素:

本发明提供一种推送信息的方法及装置,用以解决现有技术中信息推送,存在无效推送率高的技术问题。

第一方面,本发明实施例提供了一种推送信息的方法,包括:

获取信息集合中第一信息的浏览记录和所述第一信息的创建时长;

根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比;

根据所述创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关;

根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比;

基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

可选的,所述第一信息的创建时长等于当前时间戳与所述第一信息产生时的时间戳的差值。

可选的,所述根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比,包括:根据所述浏览记录,确定所述第一信息的浏览次数、所述第一信息的收藏次数和所述信息集合中全部信息的总收藏次数;以所述收藏次数除以所述总收藏次数的比值作为的所述收藏量占比。

可选的,所述根据所述创建时长,确定所述第一信息的生命周期权值,包括:根据预设的所述第一信息的信息评级,确定所述第一信息的信息存活周期;其中,所述信息存活周期与所述信息评级成正比;以所述信息存活周期与所述创建时长的差值作为所述生命周期权值。

可选的,所述基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息包括:对所述信息集合中全部信息的分值按数值由大至小的顺序进行分数排名,获得所述第一信息的分数排名;当所述第一信息的分数排名小于等于N时,推送所述第一信息,N为自然数;或者,当所述第一信息的分数排名与所述信息集合中信息数量的比值小于等于第一比值时,推送所述第一信息。

第二方面,本发明实施例提供一种推送信息的装置,包括:

获取模块,用于获取信息集合中第一信息的浏览记录和所述第一信息的创建时长;

第一确定模块,用于根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比;

第二确定模块,用于根据所述创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关;

分数确定模块,用于根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比;

推送模块,用于基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

可选的,所述第一信息的创建时长等于当前时间戳与所述第一信息产生时的时间戳的差值。

可选的,所述第一确定模块还用于:根据所述浏览记录,确定所述第一信息的浏览次数、所述第一信息的收藏次数和所述信息集合中全部信息的总收藏次数;以所述收藏次数除以所述总收藏次数的比值作为的所述收藏量占比。

可选的,所述第二确定模块还用于:根据预设的所述第一信息的信息评级,确定所述第一信息的信息存活周期;其中,所述信息存活周期与所述信息评级成正比;以所述信息存活周期与所述创建时长的差值作为所述生命周期权值。

可选的,所述推送模块还用于:对所述信息集合中全部信息的分值按数值由大至小的顺序进行分数排名,获得所述第一信息的分数排名;当所述第一信息的分数排名小于等于N时,推送所述第一信息,N为自然数;或者,当所述第一信息的分数排名与所述信息集合中信息数量的比值小于等于第一比值时,推送所述第一信息。

本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

1、本申请实施例提供的方法及装置,在推送信息时,将浏览次数、收藏量占比和生命周期权值均作为输入参数,在优先推送浏览次数多的信息来保证信息的热点程度的同时,进一步设置推送收藏量占比低的信息,以保证信息是热点信息且尚未被大多数人所浏览,以减少推送已阅无效信息的几率,再进一步,设置推送生命周期权值高的信息,在保证信息热点度和未被浏览比例的同时,还保证了信息的实效性,较大提升了推送信息的有效性。

2、本申请实施例提供的方法及装置,通过预设信息的信息评级来确定所述信息的信息存活周期;并以信息存活周期与创建时长的差值作为所述生命周期权值,从而避免推送信息创建时长超过信息存活周期的过期信息,提高推送信息的时效性,进一步提升了推送信息的有效性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中推送信息的方法的流程图;

图2为本发明实施例中推送信息的装置的结构示意图。

具体实施方式

本申请实施例通过提供一种推送信息的方法及装置,解决了现有技术中的信息推送,存在的无效推送率高的技术问题。实现了提高推送信息的有效性的技术效果。

本申请实施例中的技术方案,总体思路如下:

根据第一信息的浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比;根据第一信息的创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关;根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比;基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

上述方法通过在优先推送浏览次数多的信息来保证信息的热点程度的同时,进一步设置推送收藏量占比低的信息,以保证信息是热点信息且尚未被大多数人所浏览,以减少推送已阅无效信息的几率,再进一步,设置推送生命周期权值高的信息,在保证信息热点度和未被浏览比例的同时,还保证了信息的实效性,较大提升了推送信息的有效性。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

本实施例提供一种推送信息的方法,请参考图1,所述方法包括:

步骤S101,获取信息集合中第一信息的浏览记录和所述第一信息的创建时长;

步骤S102,根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比;

步骤S103,根据所述创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关;

步骤S104,根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比;

步骤S105,基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

需要说明的是,本申请中,所述步骤S102和所述步骤S103不分先后顺序,可以是先执行步骤S102,也可以是先执行步骤S103。

还需要说明的是,本申请中,所述步骤S101中的获取所述第一信息的创建时长与所述步骤S102也不分先后顺序;所述步骤S101中的获取信息集合中第一信息的浏览记录与所述步骤S103也不分先后顺序。

下面,结合图1对本申请提供的推送信息的方法进行详细介绍:

首先,执行步骤S101,获取信息集合中第一信息的浏览记录和所述第一信息的创建时长。

在本申请实施例中,所述第一信息为所述信息集合中的任一信息,所述信息集合可以是某网站的所有信息的集合,也可以是某搜索引擎能搜索到的信息的集合,或者是某一时间段内发布的信息的集合,或者是某个用户群体浏览过的信息集合,在本申请中不作限制。

在本申请实施例中,所述浏览记录中包括所述第一信息被浏览的次数和所述第一信息被收藏的次数。所述第一信息的创建时长等于当前时间戳与所述第一信息产生时的时间戳的差值。

进一步,为了便于对所述创建时长的统一,可以以unix时间戳(Unix epoch)来计量所述创建时长。具体来讲,unix时间戳是从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数,不考虑闰秒。UNIX时间戳的0按照ISO 8601规范为:1970-01-01T00:00:00Z;一个小时表示为UNIX时间戳格式为:3600;一天表示为UNIX时间戳为86400。

例如,所述第一信息的创建时间表示为unix时间戳为1474560000,即2016年9月23日,而假设当前时间戳为向后推移6h,即1474581600。则所述第一信息的创建时长为1474581600减去1474560000,等于21600。

当然,在具体实施过程中,也可以以惯用的秒计时方式来计量所述创建时长,在此不作限制。

再下来,执行步骤S102,根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比。

在具体实施过程中,所述浏览次数的确定可以是根据所述浏览记录中每个用户的浏览项来统计确定的,例如:

假设目前有一组用户的浏览记录如下:

用户1浏览记录:{“天宫二号”,“里约奥运会闭幕”,“G20峰会”}

用户2浏览记录:{“姚明进入名人堂”,“里约奥运会闭幕”,“残奥会开幕”}

用户3浏览记录:{“G20峰会”,“里约奥运会闭幕”,“调控房价”}

用户4浏览记录:{“里约大冒险2上映”,“里约奥运会闭幕”}

统计四组数据,可以发现各类新闻信息的浏览次数分别为:

“里约奥运会闭幕”:4次

“G20峰会”:2次

“残奥会开幕”:1次

“天宫二号”:1次...

在具体实施过程中,所述收藏量占比指所述第一信息的收藏次数在所述信息集合的总体收藏次数中所占的比例。所述收藏量占比的获取方法为:根据所述浏览记录,确定所述第一信息的收藏次数和所述信息集合中全部信息的总收藏次数;以所述收藏次数除以所述总收藏次数的比值作为的所述收藏量占比,例如:

假设一组用户浏览记录中的收藏数据如下:

用户1收藏记录:{“天宫二号”,“里约奥运会闭幕”,“G20峰会”}

用户2收藏记录:{“姚明进入名人堂”,“里约奥运会闭幕”,“残奥会开幕”}

用户3收藏记录:{“G20峰会”,“里约奥运会闭幕”,“调控房价”}

用户4收藏记录:{“里约大冒险2上映”,“里约奥运会闭幕”,“天宫二号”}

统计四组收藏数据,可以发现“里约奥运会闭幕”的收藏次数为:4次该组信息集合中总收藏次数为12次,则“里约奥运会闭幕”的收藏量占比为1/3。

接下来,执行步骤S103,根据所述创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关。

在具体实施过程中,确定所述生命周期权值的方法可以有多种,下面列举两种为例:

第一种,根据创建时长确定。

即可以设置所述生命周期权值为所述创建时长的倒数,或设置所述生命周期权值为一常数减去所述创建时长的差值,以使得所述生命周期权值与所述创建时长反相关。

第二种,根据创建时长和信息存活周期确定。

即先根据预设的所述第一信息的信息评级,确定所述第一信息的信息存活周期;其中,所述信息存活周期与所述信息评级成正比;再以所述信息存活周期与所述创建时长的差值作为所述生命周期权值。

具体来讲,可以认为信息在创建时长超过信息存活周期后,其时效性已经很低了,属于过期信息,即使其历史浏览量很高,也没有多少用户会再关注这些过期信息。而为了更贴近信息本身的情况,每个信息由于其类型或热点程度不同,对应的信息存活周期也可以设置为不相同。

即可以设置:信息存活周期等于n*hour,其中,n为信息评级,hour即为单位小时的时间戳3600。所述信息评级n可以根据信息类型而定,由信息管理者自定义评定,以新闻类信息为例,一般该类信息最高存活时间为24h,即0<n<=24,而不同类型的新闻,评级亦可不同。例如:“天宫二号”、“G20峰会”等国家重大新闻,n可直接设定为24,即其信息存活周期为24小时;而像“姚明进入名人堂”、“里约奥运会闭幕”等文娱新闻,n则可设定为12;即其信息存活周期为12小时。

而生命周期权值等于[n*hour-(unixtime_now-unixtime_create)],其中,unixtime_now为当前unix时间戳,unixtime_create为创建信息时的unix时间戳,(unixtime_now-unixtime_create)为所述创建时长。即随着时间推移,其生命周期权值也逐渐降低,直到(unixtime_now-unixtime_create)>=n*hour,即所述生命周期权值为小于等于0时,则直接判定所述生命周期权值为0,代表信息过期,不再推荐。

再下来,执行步骤S104,根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比。

具体来讲,可以设置所述分值等于:

(total_count/total_percentage)*[n*hour-(unixtime_now-unixtime_create)]

其中,total_count为所述浏览次数;total_percentage为所述收藏量占比;[n*hour-(unixtime_now-unixtime_create)]为所述生命周期权值。

需要说明的是,对某些热点信息,由于被浏览的次数较多,采用现有技术其被推荐的可能性会越大,然而,对于一个已经被很多人浏览过的信息,其实没有太大的推荐必要,本申请通过设置所述分数与所述收藏量占比成反比能减少多已经被大范围阅读过的信息的无效推送。另外,由于类似于新闻、直播等信息,由于经历某一时间点后,其信息的有效性、可阅读性相比于其他类信息会急剧降低,故本申请通过设置所述分数与生命周期权值成正比,生命周期权值与创建时长反相关,能实现推送更具时效性的信息,进一步减少了无效推送。

还需要说明的是,本申请设置所述生命周期权值等于信息存活周期与创建时长的差值,并预先根据信息类型及信息热点程度来设置信息存活周期,能针对性的将过期信息排除出推送队列,有效提升了推送的信息的有效性和实时性。

最后,执行步骤S105,基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

在具体实施过程中,确定是否推送第一信息的方法可以有多种,下面列举两种为例:

第一种,按排名名次。

即对所述信息集合中全部信息的分值按数值由大至小的顺序进行分数排名,获得所述第一信息的分数排名;当所述第一信息的分数排名小于等于N时,推送所述第一信息,N为自然数。

具体来讲,需要先确定出信息集合中的所有信息的分数,再按分数进行排名,推送排名位于前N名的信息。

例如,预设推送排名前10的信息,当第一信息的分数在信息集合中排名为3时,确定推送所述第一信息。

第二种,按排名比例。

即对所述信息集合中全部信息的分值按数值由大至小的顺序进行分数排名,获得所述第一信息的分数排名;当所述第一信息的分数排名与所述信息集合中信息数量的比值小于等于第一比值时,推送所述第一信息。

具体来讲,需要先确定出信息集合中的所有信息的分数,再按分数进行排名,推送排名位于前第一百分比的信息。

例如,信息集合中有2万条信息,预设推送排名前0.1%的信息,2万乘以0.1%等于20,即推送排名前20的信息,当第一信息的分数在信息集合中排名为3时,确定推送所述第一信息。

在介绍了本实施例提供的方法的详细流程后,为了便于理解本实施例提供的方法的完整过程,下面“里约奥运会闭幕”和“G20峰会”两条信息为例,提供所述方法的一完整实施例子:

通过步骤S101获取信息集合中“里约奥运会闭幕”和“G20峰会”的浏览记录和创建时长,假设,两条信息同时创建,创建时间戳均为1474560000,当前时间戳为1474581600。

再通过步骤S102,假设确定“里约奥运会闭幕”的浏览次数为4,收藏量占比为0.33;“G20峰会”的浏览次数为2,收藏量占比为0.17。

然后,通过步骤S103,确定“里约奥运会闭幕”和“G20峰会”的生命周期权值。考虑到“G20峰会”为国家重大新闻,预设信息评级n为24;“里约奥运会闭幕”为文娱新闻,预设信息评级n为12。则“里约奥运会闭幕”的生命周期权值为[12*3600-(1474581600-1474560000)]和“G20峰会”的生命周期权值为[24*3600-(1474581600-1474560000)]。

再下来,通过步骤S104,确定“里约奥运会闭幕”的分值为(4/0.33)*[12*3600-(1474581600-1474560000)]=261818.19;“G20峰会”的分值为(2/0.17)*[24*3600-(1474581600-1474560000)]=762352.94。

可见,虽然“里约奥运会闭幕”的浏览次数多,但由于其收藏量占比高,说明已被大量用户浏览过,且由于其信息评级较低,易于失效,故其最终分值低于“G20峰会”的分值。

最后,执行步骤S105,假设“里约奥运会闭幕”的分值排名为33;“G20峰会”的分值排名为9,预设推送前10的信息,则确定推送“G20峰会”,不推送“里约奥运会闭幕”。

基于同一发明构思,本发明实施例还提供了实施例一中方法对应的装置,见实施例二。

实施例二

本实施例提供了一种推送信息的装置,请参考图2,所述装置包括:

获取模块201,用于获取信息集合中第一信息的浏览记录和所述第一信息的创建时长;

第一确定模块202,用于根据所述浏览记录,确定所述第一信息的浏览次数和收藏量占比;其中,所述收藏量占比用于表征所述第一信息在所述信息集合中的收藏次数的占比;

第二确定模块203,用于根据所述创建时长,确定所述第一信息的生命周期权值;所述生命周期权值与所述创建时长反相关;

分数确定模块204,用于根据所述浏览次数、所述收藏量占比和所述生命周期权值,确定所述第一信息的分值;其中,所述分值与所述浏览次数和所述生命周期权值均成正比;所述分值与所述收藏量占比成反比;

推送模块205,用于基于所述分值,确定所述第一信息在所述信息集合中的分数排名,从而确定是否推送所述第一信息。

在本申请实施例中,所述第一信息的创建时长等于当前时间戳与所述第一信息产生时的时间戳的差值。

在本申请实施例中,所述第一确定模块202还用于:

根据所述浏览记录,确定所述第一信息的浏览次数、所述第一信息的收藏次数和所述信息集合中全部信息的总收藏次数;

以所述收藏次数除以所述总收藏次数的比值作为的所述收藏量占比。

在本申请实施例中,所述第二确定模块203还用于:

根据预设的所述第一信息的信息评级,确定所述第一信息的信息存活周期;其中,所述信息存活周期与所述信息评级成正比;

以所述信息存活周期与所述创建时长的差值作为所述生命周期权值。

在本申请实施例中,所述推送模块205还用于:

对所述信息集合中全部信息的分值按数值由大至小的顺序进行分数排名,获得所述第一信息的分数排名;

当所述第一信息的分数排名小于等于N时,推送所述第一信息,N为自然数;或者,当所述第一信息的分数排名与所述信息集合中信息数量的比值小于等于第一比值时,推送所述第一信息。

由于本发明实施例二所介绍的装置,为实施本发明实施例一的信息推送的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。

本申请实施例中提供的技术方案,至少具有如下技术效果或优点:

1、本申请实施例提供的方法及装置,在推送信息时,将浏览次数、收藏量占比和生命周期权值均作为输入参数,在优先推送浏览次数多的信息来保证信息的热点程度的同时,进一步设置推送收藏量占比低的信息,以保证信息是热点信息且尚未被大多数人所浏览,以减少推送已阅无效信息的几率,再进一步,设置推送生命周期权值高的信息,在保证信息热点度和未被浏览比例的同时,还保证了信息的实效性,较大提升了推送信息的有效性。

2、本申请实施例提供的方法及装置,通过预设信息的信息评级来确定所述信息的信息存活周期;并以信息存活周期与创建时长的差值作为所述生命周期权值,从而避免推送信息创建时长超过信息存活周期的过期信息,提高推送信息的时效性,进一步提升了推送信息的有效性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1