信息推送方法、装置、电子设备及计算机可读取存储介质与流程

文档序号:20439083发布日期:2020-04-17 22:16阅读:83来源:国知局
信息推送方法、装置、电子设备及计算机可读取存储介质与流程

本申请涉及互联网技术领域,更具体地,涉及一种信息推送方法、装置、电子设备及计算机可读取存储介质。



背景技术:

随着互联网技术的快速发展,互联网逐渐成为信息传播的重要途径,也是用户摄取信息的重要来源。虽然互联网上时刻存在海量信息能够供用户查看,但在海量信息面前,用户难以快速看到感兴趣的内容,例如,热点事件、热点话题等热点内容。因此为了降低用户信息摄取的难度,需从海量信息中确定出热点内容,并向用户推送。但是,目前,热点内容的推送方式过于简单,所推送的热点内容不准确。



技术实现要素:

本申请提出了一种信息推送方法、装置、电子设备及计算机可读取存储介质,以改善上述缺陷。

第一方面,本申请实施例提供了一种信息推送方法,所述方法包括:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征;在所述热度特征不满足推送条件时,将所述目标热点信息的第一状态切换为第二状态;根据处于所述第一状态的热点信息,确定推送的内容。

第二方面,本申请实施例还提供了一种信息推送装置,所述装置包括:特征获取模块,用于基于热度增长周期,获取处于第一状态的目标热点信息的热度特征;状态更新模块,用于在所述热度特征不满足推送条件时,将所述目标热点信息的第一状态切换为第二状态;热点推送模块,用于根据处于所述第一状态的热点信息,确定推送的内容。

第三方面,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述方法。

第四方面,本申请实施例还提供了一种计算机可读取存储介质,计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。

本申请提供的信息推送方法、装置、电子设备及计算机可读取存储介质,通过基于热度增长周期,获取处于第一状态的目标热点信息的热度特征,并在热度特征不满足推送条件时,将目标热点信息的第一状态切换为第二状态,,最后根据处于第一状态的热点信息,确定推送的内容。由此,本申请通过基于热度增长周期判定处于第一状态的目标热点信息的热度特征是否满足推送条件,来判断目标热点信息是否可用于推送,并根据处于第一状态的热点信息,确定推送的内容,可实现自动跟踪热点信息的生命周期,及时更新热点信息的状态,避免将不满足推送条件的热点信息所对应的内容推送给用户,从而提高内容分发的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了一种适用于本申请实施例的应用场景示意图;

图2示出了本申请一实施例提供的信息推送方法的方法流程图;

图3示出了本申请另一实施例提供的信息推送方法的方法流程图;

图4示出了本申请另一实施例提供的确定热度增长周期的方法流程图;

图5示出了本申请又一实施例提供的信息推送方法的方法流程图;

图6示出了本申请再一实施例提供的信息推送方法的方法流程图;

图7示出了本申请还一实施例提供的信息推送方法的方法流程图;

图8示出了本申请再另一实施例提供的信息推送方法的方法流程图;

图9示出了本申请再又一实施例提供的信息推送方法的方法流程图;

图10示出了本申请实施例提供的信息推送装置的模块框图;

图11示出了本申请实施例提供的电子设备的结构框图;

图12示出了本申请实施例的用于保存或者携带实现根据本申请实施例的信息推送方法的程序代码的存储单元。

具体实施方式

下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了更好理解本申请实施例提供的一种信息推送方法、装置、电子设备及计算机可读取存储介质,下面先对适用于本申请实施例的应用环境进行描述。

请参阅图1,图1为适用于本申请实施例的应用场景示意图。本申请实施例提供的信息推送方法可以应用于如图1所示的信息推送系统10中。如图1所示,信息推送系统10包括终端设备100和服务器200。

终端设备100包括但不限于笔记本电脑、台式电脑、平板电脑、智能手机、可穿戴电子设备等。

在一些实施例中,客户端安装在终端设备100内,例如,可以是安装在终端设备100的应用程序。用户操作客户端时产生的数据可以存储在服务器200的存储空间内。其中,服务器200可以是单独的服务器,也可以是服务器集群,可以是本地服务器,也可以是云端服务器,在此不作限定。

终端设备100和服务器200位于无线网络或有线网络中,终端设备100和服务器200可以进行数据交互。在一些实施方式中,服务器200可以与多个终端设备100通信连接,终端设备100之间可以相互通过互联网进行通信连接,也可以将服务器200作为传输中介,并通过互联网来实现相互间的数据交互。

在一些实施例中,终端设备100安装的客户端可接收服务器200发送的数据,并显示数据对应的内容,例如热门事件、热点话题等热点内容。服务器200可以为客户端的后台服务器,能够通过客户端为用户提供各种内容,以供用户进行查看,获取相关信息。

其中,热点内容是指在一段时期内受到用户广泛关注的资讯、事件、文章、视频等,形式各种各样,并且用户对热点内容的关注度和点击率一般远远超过其他内容。并且,热点内容往往具有时效性,在热点生命周期内为用户及时推送当前热点内容,能够大大满足用户需求,有助于增加用户转化率及留存率。

但是,发明人在研究中发现,当前热点内容在过了其热点生命周期后可能不再是用户广泛关注的内容了,如果此时还推送该热点内容,会影响推送的准确性,使得用户查看时效已过或者说已过期的热点内容。

因此,为了解决上述缺陷,如图2所示,本申请实施例提供了一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s110至s150。

s110:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

互联网时代下信息可以得到快速且大范围的传播,在一段时间内,用户的关注点往往比较集中,热点信息可以是用户所集中关注的信息。例如,热点信息可以是话题榜、热搜榜上汇聚的信息。作为一种实施方式,热点信息可以是热门的话题、词、词组、语句等,本申请实施例对热点信息的具体形式不做限定。

在一些实施例中,一个热点信息可能有多种不同的语言表达,但其所表现的主题是相同的。一个热点信息往往可对应一个或多个不同的热点内容,热点内容可以包括但不限于文章、标题、链接等文本内容,用户对热点内容的关注率可反映到该热点内容对应的热点信息上。例如,热点信息可以为“跳水冠军宣布退役”的话题,也可以为该话题的关键词“跳水冠军”、“退役”等,而该热点信息可以对应多个热点内容,如关于“跳水冠军宣布退役”的各类新闻报道、文章,关于该“跳水冠军”的生平事迹的文章等文本内容。

作为一种实施方式,服务器可以定期或不定期地通过网络爬虫或者其他信息获取方式,从预定的平台比如上述话题榜、热搜榜等网站、应用程序)中获取热点信息。例如,服务器可以爬取热搜榜上的热搜话题,作为热点信息。

作为另一种实施方式,服务器也可以获取用户基于浏览器或各类具有搜索功能的平台进行查询输入的用户搜索数据。在一个示例中,用户搜索数据可以为用户通过浏览器或含搜索服务的应用中所输入的数据等。另外,在一些示例中,用户搜索数据可以通过获取浏览器的日志获得。其中,热度增长周期为获取目标热点信息的热度特征的周期,可理解为每间隔一个热度增长周期获取一次热点信息的热度特征,实现对热点信息的周期性跟踪。热度增长周期可以是程序设定的,也可以是用户自定义的。在一些示例中,热度增长周期可以是分钟级、小时级等,在此不做限定。例如,热度增长周期可以是3分钟、4分钟、1小时、3小时等。

在一些实施例中,热度增长周期用于表征热点信息在一段时间内热度增长所需的时间。在一些实施方式中,热度增长周期可以是热点信息在一段时间内的热度从0增长到指定值所需的时间。在另一些实施方式中,热度增长周期也可以是热点信息在一段时间内的热度增量达到指定值所需的时间。

在一些实施例中,热点信息的热度可以用一种或多种热度特征衡量。其中,热度特征可以用于表征热点信息在初始数据中所呈现的数值表现。例如,热度特征可以包括但不限于热点信息在初始数据中出现的次数、频率、次数的增长率等数值表现。在本实施例中,初始数据内包含热点信息,初始数据可以是服务器从其他平台爬取的数据,也可以是用户搜索数据。

进一步地,服务器可以基于热度增长周期,获取初始数据,以获取目标热点信息在初始数据中的热度特征。例如,服务器可获取目标热点信息在初始数据中出现的次数作为热度特征。

以浏览器为例,对于新闻事件或最新的热点话题,用户会在短时间内在浏览器进行搜索,从而搜索到关于该新闻事件或热点话题的内容。因此,在新闻事件发生后的一段时间内,浏览器会接收到大量用户对某一事件或话题的大量查询输入。比如,苹果公司最新产品发布会开始后,浏览器的用户搜索数据中会大量出现关于最新的某款产品的查询输入,例如“iphone”、“ipad”等。

热点信息从出现到被用户大量搜索(达到指定搜索量)之前,存在搜索量累计所需的增长时间。例如,一个新闻事件刚出现时,还没有用户搜索,在用户搜索数据中该新闻事件被搜索的搜索次数为0次,接着逐渐开始有用户对该新闻事件进行搜索,在浏览器或各类具有搜索功能的平台,输入与该新闻事件相关的关键词,以进行搜索,由此搜索量开始累计并逐渐增大,增大至指定搜索量时,该新闻事件即在用户搜索数据中体现出其热度,而搜索量从0开始累计到指定搜索量所需的时间可以记为该新闻事件的热度增长时间。

其中,搜索量可由一种或多种数值特征进行衡量,例如,可以由搜索次数衡量,搜索次数高则搜索量高,再如,还可由搜索频率衡量,搜索频率高则搜索量高,在此不做限定。由此,服务器基于热度增长周期,获取处于第一状态的目标热点信息的热度特征,可使得目标热点信息的热度特征有足够的时间增长,而不会因为获取热度特征的时间太短,短于目标热点信息的热度增长所需的热度增长时间,导致热点信息的热度仍在持续增长但尚未增长到超过指定值之前,被认为热度不够高,而被记为非存活的热点信息。

可以理解的是,热度增长周期越长,越能避免因热度增长周期过短导致热度增长所需的热度增长时间被打散,因此越能削弱受增长时间对热度特征表现的影响,热度增长周期越短,在单位时间内获取热度特征越频繁,对热点信息的跟踪实时性越好。

在一些实施例中,服务器可根据热度增长时间确定热度增长周期。在一些实施方式中,一段时间内可能存在多个热点信息,服务器可基于其中一个热点信息的热度增长时间确定热度增长周期,也可基于多个热点信息的热度增长时间确定热度增长周期。具体的实施方式可见后述实施例,在此不再赘述。

需要说明的是,热点信息只是本申请实施例中所使用的词语,其代表的含义和作用已于本申请实施例中记载,其名称并不能对本申请实施例构成任何限制;可以理解的是,在本申请其他一些实施例中,上述词语也可以使用其他名称,例如热点词、关键词、热点话题、热点等。

其中,热点信息对应设置有状态,用于表征在当前热度增长周期内,热点信息是否存活。具体地,热点信息的状态可包括第一状态和第二状态,其中,第一状态用于表征热点信息还处于其热点生命周期内,即表征热点信息仍处于存活状态,可被用于推送;第二状态用于表征热点信息已不处于其热点生命周期内,即表征热点信息处于非存活状态,不可被用于推送。由此,通过获取处于第一状态的目标热点信息的热度特征,可获取当前热度增长周期内,尚且处于热点生命周期内的目标热点信息的热度特征,对仍处于热点生命周期的热点信息进行热度跟踪,以通过热度特征确定热点信息是否仍处于热点生命周期内,从而确定热点信息是否可继续被用于推送。

需要说明的是,热点信息的热点生命周期用于表征该热点信息受到广泛关注的时间段,若热点信息处于其热点生命周期内,可认为热点信息仍是用户关注或感兴趣的信息,而若热点信息不处于其热点生命周期内,可认为该热点信息已过期,用户对该热点信息的关注度已不高,此时可认为热点信息已过期或失效。

s120:在热度特征不满足推送条件时,将目标热点信息的第一状态切换为第二状态。

获取热度特征后,可在热度特征不满足推送条件时,将目标热点信息的第一状态切换为第二状态,使得该目标热点信息不可被用于推送。从而实现基于热度增长周期对处于第一状态的热点信息的热度跟踪,在热点信息的热度特征不满足推送条件时,及时更新目标热点信息的状态,将目标热点信息的第一状态切换为第二状态,以避免推送处于第二状态的热点信息所对应的内容。

在一些实施方式中,在目标热点信息的热度特征满足推送条件时,可认为目标热点信息仍处于热点其生命周期,即仍是当下受到用户广泛关注的热点,此时可不对目标热点信息的状态进行切换,仍保持为第一状态,使得该目标热点信息仍可被用于推送。

在一些实施方式中,热度特征的特征值可包括但不限于搜索次数、搜索次数排名、搜索次数增长率、搜索频率、搜索频率增长率和搜索频率排名等。每个特征值可对应有指定的阈值条件,通过将特征值与特征值对应的阈值条件进行比较,可判断热度特征是否满足推送条件。在一个示例中,当热度特征的特征值为搜索频率时,若同一时段内的目标热点信息被搜索的频率超过指定的频率阈值,即搜索频率超过指定的频率阈值,可判定目标热点信息的热度特征满足推送条件,目标热点信息还存活,尚且还处于该目标热点信息的热点生命周期内,若搜索频率未超过指定的频率阈值,可判定目标热点信息的热度特征不满足推送条件,即目标热点信息已不处于其热点生命周期内,即非存活。

在一些实施方式中,当热度特征包括多个特征值时,可以在每个特征值均满足对应的阈值条件时,判定热度特征满足推送条件,也可以在任意一个或多个特征值满足对应的阈值条件时,判定热度特征满足推送条件。在一个示例中,热度特征可包括多个特征值,可对多个特征值分别设置优先级,并基于优先级,判断热度特征是否满足推送条件。在另一个示例中,可按照指定顺序依次对多个特征值进行判断。在又一个示例中,还可对多个特征值分别设置权重,并基于权重,判断热度特征是否满足推送条件。

可选地,可设置搜索频率增长率、搜索频率、搜索频率排名的优先级依次从高至低,此时,在搜索频率增长率高于第一指定值时,无论其他两个特征值如何,均可判定热度特征满足推送条件,而不将目标热点信息的第一状态切换为第二状态。由此,可避免因目标热点信息的搜索频率还在快速增长期时,却因搜索频率或搜索频率排名不高而被过早判定为不满足推送条件,从而可降低误判率,实现更准确的热度跟踪。

可选地,在前述优先级设置下,若搜索频率增长率低于第二指定值,无论其他两个特征值如何,均可判定热度特征不满足推送条件,而将目标热点信息的第一状态切换为第二状态。其中,第二指定值低于第一指定值。由此,可在目标热点信息的搜索频率大幅降低,但搜索频率仍较高时,提前判定目标热点信息失效,从而可提高热度跟踪的实时性,及时更改目标热点信息的状态,避免推送已不处于热点生命周期内的热点信息对应的内容,即避免过期推送,提高推送准确性。

在一些实施方式中,热度特征的特征值可以包括搜索次数、搜索次数排名以及搜索次数增长率,服务器可按照指定顺序对三个特征值进行判断。具体地,服务器获取热点信息,可先判断搜索次数增长率是否超过指定次数增长率;在超过指定次数增长率时,判定热点信息满足推送条件;在未超过指定次数增长率时,获取搜索次数和搜索次数排名,判断搜索次数是否超过指定次数,搜索次数排名是否在指定次数排名内。

由于在一天中的不同时间段,服务器获取的初始数据的数据量存在差异,热度特征的特征值可能会有较大差异,而如果仅基于搜索次数判断热度特征是否满足推送条件,可能不准确。例如,初始数据为用户搜索数据时,有的时间段用户搜索数据的搜索量高,有的时间段搜索量低。在搜索量高的时候,可能实际非存活的热点信息被搜索的搜索次数也会超过指定次数。例如,指定次数为1500次,指定次数排名为30名,服务器在10:00-10:05获取的初始数据,数据量大,搜索次数最高,即搜索次数排名最前的搜索次数为10000次,而真实非存活的热点信息的搜索次数也达到1600次,超过指定次数,但该热点信息的搜索次数排名处于第100名,此时若仅通过搜索次数判断热点信息是否满足推送条件,可能会将非存活的热点信息判定为存活,也就是将已不处于热点生命周期的热点信息误判为仍处于热点生命周期,从而导致误判。

因此,在一些实施例中,服务器可获取搜索次数排名,通过判断搜索次数排名是否在该时间段处于指定排名内,在搜索次数超过指定次数、且搜索次数排名处于指定次数排名内时,判定热点信息不满足推送条件,而在搜索次数未超过指定次数或搜索次数排名未处于指定次数排名内时,判定热点信息满足推送条件。由此,根据搜索次数增长率作第一次判断,对未超过搜索次数增长率的热点信息进行进一步判断,并基于搜索次数和搜索次数排名,可避免因初始数据的数据量差异导致误判,不仅可提高判定的准确性,提高热度跟踪的准确性,还可提高运行效率,进而提高内容分发效率。

s130:根据处于第一状态的热点信息,确定推送的内容。

存活的热点信息仍处于该热点信息的生命周期内,服务器可根据处于第一状态的热点信息,确定推送的内容,推送的内容可包括处于第一状态的热点信息对应的内容,推送的内容用于向用户终端推送。

处于第一状态的热点信息可以有一个或多个。在一种实施方式中,服务器可获取每个处于第一状态的热点信息所对应的内容,并将前述内容作为推送的内容。在另一种实施方式中,服务器也可在多个处于第一状态的热点信息中确定待推送的热点信息,并将待推送的热点信息对应的内容作为推送的内容。其中,待推送的热点信息的数量可以小于处于第一状态的热点信息的数量。

在一种实施方式中,服务器可存储有多个热点信息,每个热点信息具有对应的状态。若热点信息的状态为第一状态,可认为热点信息尚未过期或失效,仍处于其热点生命周期内,仍可继续向用户推送该热点信息对应的内容,而若热点信息的状态为第二状态,可认为热点信息失效。由此,服务器根据处于第一状态的热点信息,确定推送的内容,可避免向用户终端推送过期的内容,提高用户体验。

在一种实施方式中,服务器可基于推荐算法向用户终端发送推送内容,服务器可获取热点信息从第一状态切换为第二状态的时刻,并将该时刻作为该热点信息的热点生命周期终止的热点终止时间,并将热点终止时间反馈至推荐业务模块,以及时加入到推荐算法迭代中,避免向用户终端推送处于第二状态的热点信息对应的内容,以避免推送过期内容,从而提高内容分发的准确性。

由于在实际应用中,若将处于第二状态的热点信息所对应的内容推送给用户,使得用户在对非存活的热点信息已不感兴趣时,仍接收到相关内容的推送,会降低用户体验度。因此,本申请实施例通过基于热度增长周期,获取处于第一状态的热点信息热度特征,并通过判断热度特征是否满足推送条件,来对目标热点信息是否处于其热点生命周期进行判定,并最终根据处于第一状态的热点信息,确定推送的内容,从而实现自动跟踪热点信息的热点生命周期,可避免向用户推送非存活的热点信息所对应的内容,提高推送准确性。并且由于热度特征是基于热度增长周期获取的,使得每次获取热度特征前,目标热点信息的热度特征有足够的时间增长,而不会因为获取热度特征的时间太短,短于目标热点信息的热度增长所需的增长时间,导致热点信息的热度仍在持续增长但尚未增长到超过指定值之前,被认为热度不够高,而被记为非存活的热点信息,由此热度特征可更准确反映热点信息是否处于其热点生命周期内,可提高对热点信息的热点生命周期的跟踪准确性,降低误判率。

另外,在一些实施例中,服务器可基于热度增长周期,周期性地获取处于第一状态的目标热点信息的热度特征,以周期性地跟踪热点信息的生命周期,及时判定热点信息是否仍处于其热点生命周期,从而提高跟踪准确性,并可及时更新热点信息的状态,避免推送处于第二状态的热点信息对应的过期内容,进而提高内容分发准确性,提高用户体验。具体地,请参阅图3,示出了本申请实施例提供的一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s210至s270。

s210:获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息。

当前热度增长周期内处于第一状态的热点信息可以有一个或多个,包括在前一热度增长周期的推送条件判定中,热度特征满足推送条件的热点信息。具体地,在一些实施方式中,可将前一热度增长周期内,热度特征满足推送条件的目标热点信息作为当前热度增长周期内处于第一状态的热点信息。

获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息,以对目标热点信息执行后续的推送条件判定。在当前热度增长周期内处于第一状态的热点信息存在多个时,可将多个处于第一状态的热点信息分别作为目标热点信息,以分别执行热度条件的判定,从而可分别跟踪当前热度增长周期内多个处于第一状态的热点信息的热点生命周期。

在一些实施方式中,服务器存储有热点信息库,用于存储热点信息。在推送条件判定后,即在判断热度特征是否满足推送条件后,可将处于第二状态的热点信息从热点信息库中移出,使得热点信息库中保留处于第一状态的热点信息,并在根据处于第一状态的热点信息,确定推送的内容时,从热点信息库中确定待推送的热点信息,以将待推送的热点信息对应的内容推送给用户终端。由此,可通过获取热点信息库中的热点信息,获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息。

在另一些实施方式中,热点信息对应设置有存活状态标志位,存活状态标志位可以为存活标志或非存活标志。例如,存活状态标志可以为1或0,1表征第一状态,0表征第二状态。由此,服务器可通过获取当前热度增长周期内存活状态标志位为1的热点信息作为当前热度增长周期内处于第一状态的热点信息,并将当前热度增长周期内处于第一状态的热点信息作为目标热点信息。

在一些实施例中,服务器在基于热度增长周期,获取处于第一状态的目标热点信息的热度特征之前,可以根据多个热点信息的热度特征,确定热度增长周期。具体地,请参阅图4,本申请实施例提供了一种确定热度增长周期的方法,具体地,该方法包括:s310至s330。

s310:获取多个热点信息的热度特征。

获取多个热点信息的热度特征,多个热点信息可以是在同一时间段内处于第一状态的热点信息,也可以为在不同时间段内处于第一状态的热点信息,在此不做限定。

s320:获取每个热点信息的热度特征的增长时间。

以基于用户搜索数据获取热点信息的热度特征为例,热点信息从出现到被用户大量搜索(达到指定搜索量)之前,存在搜索量的累计时间。其中,搜索量可由一种或多种热度特征的特征值进行衡量,例如,可以由搜索次数衡量,搜索次数高则搜索量高;再如,还可由搜索频率衡量,搜索频率高则搜索量高,在此不做限定。因此,搜索量的变化可由热度特征的特征值来衡量,搜索量的累计时间由热度特征的增长时间反映,可将该搜索量的累计时间记为该热点信息的热度特征的增长时间,则增长时间可以为热点信息从出现到被用户大量搜索至搜索量达到指定搜索量时所需的时间。

在一种实施方式中,增长时间为热度特征的特征值增长到指定值所需的增长时间,其中,热点信息的热度特征的特征值可与热点信息的搜索量对应,特征值的指定值可与指定搜索量对应。其中,不同的热度特征的特征值,可对应不同的指定值。服务器通过获取每个热点信息的热度特征的增长时间,可获取每个热点信息从搜索量为0至搜索量达到指定搜索量所需的时间。例如,热度特征的特征值为搜索次数时,指定值可以为1600等,增长时间可以为搜索次数从0增长至1600时所需的时间;热度特征的特征值为搜索频率时,指定值可以为10%等,增长时间可以为搜索频率从0%增长至10%时所需的时间;热度特征的特征值为搜索频率排名时,指定值可以为30等,增长时间可以为热点信息从开始到搜索频率排名达到30名或20名以内时所需的时间。

在一种具体的实施方式中,以热度特征的特征值为搜索频率为例,可将获取到热点信息的时刻作为起始时刻,服务器基于该热点信息,获取热点信息在用户搜索数据中的搜索频率,并将搜索频率逐渐累计直到达到指定频率的时刻作为结束时刻,根据起始时刻和结束时刻,可获取每个热点信息的起始时刻和终止时刻,可获取每个热点信息的增长时间。

s330:基于每个增长时间,确定热度增长周期。

基于多个热点信息中每个热点信息的增长时间,确定热度增长周期,使得热度增长周期不短于每个热点信息的热度特征的增长时间。由于,若热度增长周期过短,短于每个热点信息的热度特征的增长时间,那么在基于热度增长周期获取热度特征时,增长时间会被过短的热度增长周期打散,使得每个热度增长周期内热点信息的热度特征不足以准确反映热点信息的存活情况。

由此,通过基于每个增长时间,确定热度增长周期,可使得目标热点信息的热度特征在每个热度增长周期有足够的时间增长,而不会因为热度增长周期设置过短,导致获取热度特征的时间太短,短于热点信息的热度特征增长所需的增长时间,导致热点信息的热度特征仍在持续增长但尚未增长到超过指定值之前,被认为热度不够高,而被记为非存活的热点信息。使得向用户推送内容时遗漏了部分热点内容,影响内容分发效果,因此通过增长时间确定热度增长周期,可提升内容分发的准确性。

在一些示例中,以热度特征的特征值包括搜索频率为例,若目标热点信息被设置为存活的时间(即目标热点信息刚被发现的时间)为10:02,用户对目标热点信息进行搜索,并搜索频率累积到热度频率需3分钟,即目标热点信息的热度特征的增长时间为3分钟。此时,如果以3分钟为热度增长周期,从10点开始统计热度特征,连续统计三个热度增长周期如[10:00,10:03),[10:03,10:06),[10:06:10:09),那么[09:57,10:00)是一个无感周期,即目标热点信息不处于其热点生命周期的时期(此时热度特征在低位,比如按百分制衡量特征显著性是5分),[10:00,10:03)周期是一个渐变的过程(搜索频率正在增长中,比如按百分制衡量特征显著性是20分),[10:03,10:06)周期中,每一时刻的搜索频率均高于热度频率(搜索频率在较高位,比如按百分制衡量特征显著性是75分),[10:06:10:09)周期中搜索频率仍高于热度频率并在继续累计(热度特征处于较高位,比如按百分制衡量特征显著性是90分)。由此,可发现相邻热度增长周期的分数相差不大,热度特征在每个热度增长周期的显著性不高。

而若以5分钟为热度增长周期,连续统计三个热度增长周期如[09:55,10:00),[10:00,10:05),[10:05,10:10),分别对应分数5,80,95,此时就会有一对相邻热度增长周期的比值很大的情况,即热度特征在该对相邻热度增长周期的显著性较高。再如,目标热点信息被发现的时间为10:04,[09:55,10:00)为无感周期,对应分数5,[10:00,10:05)初步累计周期仅1分钟,对应分数10,[10:05,10:10)可对应分数97,此时在相邻热度增长周期间会存在绝对值大且变化比值大的特征,其主要原因是设置的热度增长周期至少大于等于目标热点信息的热度特征的增长时间,能削弱热度特征错位的影响,削弱热度特征的增长时间被热度增长时间打散的影响,使得每个热度增长周期获取的热度特征可比较显著反映热点信息。从而可有效避免因热度增长周期设置地过短,短于搜索频率的增长时间,而把搜索频率的增长时间打散,不利于获得较为显著的热度特征,同时,又可避免因热度增长周期设置地过大,所导致的热度条件判定时间过长,避免降低判定效率。

在一些实施例中,基于每个增长时间,确定热度增长周期的具体实施方式可以为:将每个增长时间中最长的增长时间,确定为热度增长周期。通过将最长的增长时间确定为热度增长周期,可大大削弱增长时间对热度特征表现的影响,使得每个热度增长周期获取的热度特征较为显著。

在另一些实施例中,基于每个增长时间,确定热度增长周期的具体实施方式可以为:基于每个增长时间,获取平均增长时间,并将平均增长时间确定为热度增长周期。其中,平均增长时间可以通过对每个热点信息的热度特征的增长时间求平均获得。由此,不仅可避免过度打散热度特征的增长时间,导致每个热度增长周期的热度特征不够显著,影响对热点信息是否存活的判定准确率,而且还可避免热度增长周期过长,使得获取热度特征的间隔较短,保证良好的跟踪实时性。

s220:获取目标热点信息的热度特征。

s230:判断热度特征是否满足推送条件。

于本实施例中,判断热度特征是否满足推送条件之后,可包括:

在热度特征不满足推送条件时,可执行s240;

在热度特征满足推送条件时,可执行s250。s240:将目标热点信息的第一状态切换为第二状态。

在热度特征不满足推送条件时,将目标热点信息的第一状态切换为第二状态。

s250:根据处于第一状态的热点信息,确定推送的内容。

s260:将处于第一状态的热点信息作为下一热度增长周期内处于第一状态的热点信息。

每一热度增长周期对应有周期数,若当前热度增长周期的周期数为2,下一热度增长周期的周期数可为3。服务器通过将处于第一状态的热点信息作为下一热度增长周期内处于第一状态的热点信息,可以使得下次跟踪的热点信息是存活的,而不对非存活的热点信息进行继续跟踪,从而可避免对已确定非存活的热点信息进行跟踪,降低不必要的资源耗费,提高跟踪效率和对处于第一状态的热点信息的跟踪实时性。

在一些实施方式中,服务器存储有热点信息库,用于存储热点信息。将存活的热点信息作为下一热度增长周期内存活的热点信息的具体实施方式可以为:将处于第二状态的热点信息从热点信息库中移出,将热点信息库中处于第一状态的热点信息作为下一热度增长周期内存活的热点信息,并在下一热度增长周期从热点信息库中获取热点信息作为目标热点信息,以继续对热点信息库中的热点信息进行跟踪。

在另一些实施方式中,热点信息对应设置有存活状态标志位,存活状态标志位可以包括第一状态对应的存活标志或第二状态对应的非存活标志。例如,存活状态标志位可以为1或0,1表征第一状态,0表征第二状态。由此,将处于第一状态的热点信息作为下一热度增长周期内处于第一状态的热点信息的具体实施方式可以为:将存活状态标志位为存活标志的热点信息作为下一热度增长周期内处于第一状态的热点信息。

s270:在下一热度增长周期的周期数小于指定周期数时,将下一热度增长周期作为当前热度增长周期。

为了对热点信息的热点生命周期进行跟踪,可对处于第一状态的热点信息进行持续多个热度增长周期的跟踪,为表述方便,将持续多个热度增长周期的跟踪记为一轮的热度跟踪。一轮的热度跟踪包括指定周期数个热度增长周期,根据指定周期数可确定对一轮的热度跟踪的跟踪时长,跟踪时长为指定周期数个热度增长周期。在一轮的热度跟踪中,每一热度增长周期对应一个周期数,最大周期数为指定周期数。

在一些示例中,若一轮的热度跟踪的指定周期数为10,则该轮的热度跟踪包括10个热度增长周期,热度增长周期的周期数从1开始,每执行一次s210至s250,则周期数可加一,并将存活的热点信息作为下一热度增长周期内处于第一状态的热点信息,在下一热度增长周期的周期数小于指定周期数时,将下一热度增长周期作为当前热度增长周期,并返回执行s210,直到热度增长周期的周期数等于指定周期数10时停止,结束本轮10个热度增长周期的热度跟踪。由此,实现了一轮的热度跟踪,并且一轮热度跟踪的时间长度为指定周期数个热度增长周期。

在一些实施方式中,若以天为单位,可在一天内进行一轮或多轮的热度跟踪。由于热点信息的热度是持续的,但用户搜索数据不是持续的,在夜晚基本没有用户进行搜索,也就基本没有用户搜索数据。也就是说,一天内的不同时间段内用户搜索数据的数据量不同,有的时间段用户搜索数据的数据量较少,有的时间段较多。因此,在不同时间段进行的热度跟踪,所基于的用户搜索数据的数据量不同。在一些示例中,若用户搜索数据的数据量较少,热点信息在该用户搜索数据的热度特征不显著,实际上难以准确反映热点信息的热度情况。

例如,在夜晚如22:00至24:00之间,用户一般很少进行搜索,用户搜索数据很少,但实际上热点信息的热度可能从18:00一直持续到第二天的19:00,但并未在22:00至24:00的用户搜索数据中体现出来,使得若在22:00至24:00进行热度跟踪,容易将实际上热度仍持续的存活的热点信息误判为非存活。由此,在一些实施例中,服务器可在一天的9:00-21:00或10:00-20:00之间设置一轮或多轮的热度跟踪,从而避开用户搜索数据较少的时间段,使得每轮的热度跟踪所基于的用户搜索数据的数据量较大,有利于通过热度特征准确跟踪热点信息的热点生命周期,以提高热度跟踪准确性。

本实施例通过在每个热度增长周期,获取在当前热度增长周期处于第一状态的热点信息作为目标热点信息,进行推送条件判定,以更新下一热度增长周期内处于第一状态的热点信息,并在下一热度增长周期的周期数小于指定周期数时,将下一热度增长周期作为当前热度增长周期,返回执行获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息。从而按照指定周期数,在每个热度增长周期对处于第一状态的热度信息的热度特征进行推送条件判定,在每个热度增长周期更新处于第一状态的热点信息,实现对热点信息的热点生命周期的持续跟踪,及时确定已不处于热点生命周期的非存活的热点信息,避免推送已不受用户广泛关注的过期内容。

可选地,在一些实施例中,热度特征的特征值可包括搜索频率、搜索频率增长率和搜索频率排名中的至少一个。作为一种实施方式,热度特征的特征值可包括搜索频率,可通过搜索频率确定是否将目标热点信息的第一状态切换为第二状态,可准确地确定热点终止时间,并及时确定目标热点信息是否存活,以免造成过期推送。

另外,搜索频率增长率可用于表征当前获取的搜索频率相较于之前获取的搜索频率的增速。并可以理解的是,搜索频率增长率越高,说明增速越快,热点信息被用户搜索的次数增长地越快。而在增长够快,如搜索频率增长率超过热度增长率时,可认为目标热点信息的搜索频率即将达到热度频率。因此,作为另一种实施方式,当热度特征的特征值包括搜索频率增长率时,通过获取目标热点信息的搜索频率增长率判断热度特征是否满足推送条件,可在目标热点信息的搜索频率处于快速增长期但又尚未达到热度频率时,认为热点信息下一次的搜索频率有足够可能超过热度频率,由此可更快更及时地将目标热点信息的第一状态切换为第二状态,提高跟踪实时性。

另外,搜索频率排名可用于控制服务器同时跟踪的热点信息的数量。由此,作为又一种实施方式,当热度特征的特征值包括搜索频率排名时,通过获取目标热点信息的搜索频率排名判断热度特征是否满足推送条件,不仅可缩短获取热度特征的时间,提高对热点信息的跟踪实时性,以更准确及时地向用户推送,提升用户体验。

在一个示例中,服务器可将搜索频率排名在热度排名外的热点信息的第一状态切换为第二状态,以在下次获取热度特征时,不获取处于第二状态的热点信息的热度特征。在另一个示例中,服务器存储有热点信息库,服务器跟踪热点信息库中的热点信息。服务器根据搜索频率排名,将不处于热度排名内的热点信息从热点信息库中删除,以在下次仅获取处于热度排名内的热点信息的热度特征,缩短获取热度特征的时间过长,提高热度特征的获取效率,从而有利于提高热点跟踪的实时性。

在一些实施方式中,热度特征的特征值还可以是特征值之间的两两组合,例如热度特征的特征值可包括搜索频率和搜索频率增长率,也可包括搜索频率和搜索频率排名,还可包括搜索频率增长率和搜索频率排名,在此不做限定。

另外,当热度特征的特征值包括搜索频率以及搜索频率增长率时,可在目标热点信息的搜索频率突然大幅降低,但还未降低至低于热度频率时,也可认为目标热点信息已不处于其热点生命周期,从而更快判别目标热点信息是否存活,提高判别效率,提高对热点信息进行跟踪的实时性。具体地,请参阅图5,示出了本申请实施例提供的一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s410至s450。

s410:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

在一种实施方式中,热度特征可以是基于用户搜索数据获取的。具体地,从浏览器后台获取用户搜索数据,并通过统计目标热点信息在用户搜索数据中的特征作为热度特征。例如,通过统计目标热点信息在用户搜索数据中出现的次数,可获取目标热点信息的搜索频率,并将搜索频率作为一种热度特征的特征值。其中,用户搜索数据可以是多个用户基于浏览器输入的数据。由于用户搜索数据往往是用户主动输入的,因而用户搜索数据所包括的热点信息往往是用户主动关注的热点信息,因此通过用户搜索数据获取热度特征,可有利于提高后续向用户推送内容的准确性,使得所推送内容更符合用户需求。

在另一种实施方式中,热度特征还可以是服务器通过爬虫技术从平台上爬取的数据,来获取热度特征。例如,服务器可爬取社交网站上的社交数据,统计目标热点信息在社交数据中出现的次数、在某些地区出现的次数等,作为目标热点信息的热度特征。

服务器在获取目标热点信息的热度特征前,还需要对数据进行预处理操作,通过预处理操作可过滤无效字符和特殊字符,保留正常语义的文本。在一种实施方式中,预处理操作可包括分词处理。其中,分词处理可以基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。在一个示例中,分词操作可以使用jieba分词器,一种可用于中文分词(chinesewordsegmentation)的分词工具。

在一些实施方式中,预处理操作还可包括去掉停用词。在一个示例中,服务器基于停用词表去掉停用词。其中,停用词表主要包括日常用语,停用词的特点是词语出现频率高但数据价值低,因此引入停用词表可以在分词过程中屏蔽停用词,减少计算量,提高分词效率。停用词可以是,但不限于英文字符、数字、数学字符、标点符号和使用频率较高的字等。例如,“和”、“的”、“在”等。

其中,热度特征的特征值可以为一个特征值或为多个特征值的组合。在一些实施例中,热度特征的特征值可以包括搜索频率、搜索频率增长率和搜索频率排名中的至少一个。其中,搜索频率可用于表征目标热点信息在当前初始数据中出现的频率;搜索频率增长率可表征当前获取的搜索频率相较于之前获取的搜索频率的增速,可以通过先获取当前获取的搜索频率相较于之前获取的搜索频率的增量,然后计算增量占之前获取的搜索频率的百分比作为搜索频率增长率;搜索频率排名可表征当前获取的搜索频率在初始数据中的排名,排名由前往后对应搜索频率由高到低,搜索频率排名可用于控制服务器同时跟踪的热点信息的数量。

在其他一些实施例中,热度特征的特征值还可采用其他的指标如搜索次数、搜索次数增长率、搜索次数排名、搜索地区等,前述指标可分别用于表征目标热点信息在当前初始数据中出现的次数、次数的增长率、次数排名、次数高的地区等。需要说明的是,上述热度特征的特征值仅为举例说明,不对本实施例构成限定。

s420:判断搜索频率是否超过热度频率。

其中,热度频率可以根据需用户对热点信息的关注度或点击率进行确定,用户的关注度或点击率越高,热度频率可越高。在一个示例中,热度频率可以是5%-20%,具体地,例如,热度频率可以是5%、10%、20%等,即判断用户在初始数据中热点信息被搜索的频率是否超过5%、10%或20%等。通过搜索频率可反映热点信息在初始数据中的热度或用户对热点信息的关注度、点击率占当前初始数据的比例,比例越高,搜索频率越高。若初始数据是用户搜索数据,搜索频率可反映在当前某一时段内的用户搜索数据中,目标热点信息被搜索的频率。

在一些实施例中,判断搜索频率是否超过热度频率的具体实施方式可以为:基于初始数据的数量和热度频率,获取热度次数;判断搜索次数是否超过热度次数。即可通过搜索次数判断搜索频率是否超过热度频率,其中热度次数的设置与初始数据的数量有关,例如经数据预处理操作后,初始数据包括15000个词,热度次数可以是1500。由此,通过比较搜索次数和热度次数之间的大小关系,可反映热点信息在初始数据中的热度或用户对热点信息的关注度、点击率等。在一个示例中,搜索次数可通过统计在对初始数据进行预处理操作后得到的所有词中,目标热点信息出现的次数得到。

在一些实施方式中,服务器可根据搜索频率排名,确定热度频率。在一个时间段内,若目标热点信息的搜索频率高,该目标热点信息的搜索频率排名也会靠前。由于搜索频率排名可用于控制服务器同时跟踪的热点信息的数量,通过搜索频率排名确定热度频率,有利于提高运行效率,进而提高内容分发效率。例如,若搜索频率排名设置为30,那么在一次判定后,可将搜索频率排名超过30的热点信息作为非存活的热点信息,以不在下次对该热点信息进行跟踪。

于本实施例中,判断搜索频率是否超过热度频率后,还包括:

若搜索频率超过热度频率,可执行步骤s430;

若搜索频率未超过热度频率,可执行步骤s440。

s430:判断搜索频率增长率是否超过第一热度增长率。

若搜索频率超过热度频率,判断搜索频率增长率是否超过第一热度增长率。其中,第一热度增长率用于表示当前搜索频率相较于前一次的搜索频率的降低幅度大于指定幅度。

在一些实施方式中,第一热度增长率可以是负值。例如,第一热度增长率可以为-1000%至-300%之间的任意数值,具体地,第一热度增长率可以为-600%,通过判断搜索频率增长率是否超过第一热度增长率,可判断搜索频率是否大幅降低,由此可以在搜索频率还处于快速下降期,但又尚未下降到低于等于热度频率时,可通过判断搜索频率增长率是否超过第一热度增长率,提前判定热点信息是否失效,提高判定效率,有利于提高热点信息的跟踪实时性,以更准确地进行内容分发。

于本实施例中,判断搜索频率增长率是否超过第一热度增长率后,还包括:

若搜索频率增长率未超过第一热度增长率,可执行步骤s440;

若搜索频率增长率超过第一热度增长率,可不切换目标热点信息的第一状态,执行步骤s450。

s440:将目标热点信息的第一状态切换为第二状态。

若搜索频率未超过热度频率,或若搜索频率增长率未超过第一热度增长率,服务器可将目标热点信息的第一状态切换为第二状态。由此,在搜索频率不够高或者搜索频率大幅降低时,可认为目标热点信息已超出其生命周期,而将目标热点信息的第一状态切换为第二状态,以不根据非存活的热点信息确定推送的内容,从而避免将非存活的热点信息所对应的内容推送给用户,提高内容分发的准确性。

s450:根据处于第一状态的热点信息,确定推送的内容。

在一种实施方式中,服务器存储有热点信息库,热点信息库中存储有多个热点信息。在一个示例中,若热点信息的热度特征不满足推送条件,此时可认为热点信息已不处于其热点生命周期内,服务器可将该热点信息从热点信息库中删除,使得服务器基于热点信息库中包括的热点信息向用户终端推送内容时,不会推送处于第二状态的热点信息所对应的内容。

另外,在一些实施方式中,服务器确定处于第一状态的热点信息后,根据处于第一状态的热点信息,确定推送的内容时,还可通过提高对处于第一状态的热点信息的推送权重,以提高处于第一状态的热点信息被推送至用户终端的概率,从而辅助个性化推送。

需要说明的是,上述步骤中未详细描述的部分,可参考前述实施例,在此不再赘述。

另外,在一些实施例中,当热度特征包括搜索频率以及搜索频率增长率时,若搜索频率未超过热度频率,还可继续判断搜索频率是否大幅增长,若大幅增长也可认为目标热点信息仍处于其热点生命周期内,由此可降低误判率,避免仅通过搜索频率的比较所导致的、将搜索频率处于快速增长期但还未来得及超过热度频率的热点信息误判为非存活,而误将第一状态切换为第二状态。具体地,请参阅图6,示出了本申请实施例提供的一种信息推送方法,该方法包括:s510至s550。

s510:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

s520:判断搜索频率是否超过热度频率。

于本实施例中,判断搜索频率是否超过热度频率后,还包括:

若搜索频率未超过热度频率,可执行步骤s530;

若搜索频率超过热度频率,可执行步骤s550。

s530:判断搜索频率增长率是否超过第二热度增长率。

其中,第二热度增长率大于第一热度增长率,并第二热度增长率越大,下一次获取的搜索频率超过热度频率的概率越大。在一个示例中,第二热度增长率可以为300%至1000%之间的任意数值,具体地,第二热度增长率可以为600%。

若搜索频率超过热度频率,判断搜索频率增长率是否超过第二热度增长率。其中,第二热度增长率用于衡量当前搜索频率是否相较于前一次的搜索频率有大幅增长。

在一些实施方式中,第二热度增长率可以是600%等,通过判断搜索频率增长率是否超过第二热度增长率,可判断搜索频率是否大幅增长,由此可以在搜索频率还处于快速增长期,但又尚未增长到超过热度频率时,可通过判断搜索频率增长率是否超过第二热度增长率,判定热点信息是否还处于其热点生命周期内,并在搜索频率增长率超过第二热度增长率时,可认为目标热点信息还处于其热点生命周期内,由此,可降低误判率,提高对热点信息是否失效的判别准确性,避免仅通过搜索频率的比较所导致的、将搜索频率处于快速增长期、但又还未来得及超过热度频率的热点信息误判为非存活。

于本实施例中,判断搜索频率增长率是否超过第二热度增长率后,还包括:

若搜索频率增长率未超过第二热度增长率,可执行步骤s540;

若搜索频率增长率超过第二热度增长率,可执行步骤s550。

s540:将目标热点信息的第一状态切换为第二状态。

若搜索频率增长率未超过第二热度增长率,将目标热点信息的第一状态切换为第二状态。由此,在搜索频率不够高且搜索频率也并没有大幅增长时,可认为目标热点信息已超出该目标热点信息的热点生命周期,通过将目标热点信息的第一状态切换为第二状态,以不根据非存活的热点信息确定推送的内容,从而避免推送非存活的热点信息对应的内容给用户终端,提高推送准确性。

s550:根据处于第一状态的热点信息,确定推送的内容。

需要说明的是,上述步骤中未详细描述的部分,可参考前述实施例,在此不再赘述。

另外,在一些实施例中,在热度特征不满足推送条件时,通过判断持续时间长度是否达到热度时长阈值,其中,持续时间长度为热度特征持续满足热度条件的时间长度,并在持续时间长度达到热度时长阈值时,将目标热点信息的第一状态切换为第二状态。由此,一方面可提高对热点信息的热点生命周期的跟踪准确性,降低误判率,避免因热度特征短时间不满足推送条件,即将目标热点信息的第一状态切换为第二状态,另一方面还可兼顾跟踪的实时性,提高对热点信息是否存活的判定效率。具体地,请参阅图7,示出了本申请实施例提供的一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s610至s650。

s610:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

s620:判断热度特征是否满足推送条件。

于本实施例中,判断热度特征是否满足推送条件之后,还包括:

在热度特征不满足推送条件时,可执行s630;

在热度特征满足推送条件时,可执行s650。

s630:判断持续时间长度是否达到热度时长阈值。

其中,持续时间长度为热度特征持续不满足推送条件的时间长度。通过判断持续时间长度是否达到热度时长阈值,可判断热度特征持续不满足推送条件是否达到热度时长阈值。

其中,热度时长阈值可以是程序设定的,也可以是用户自定义的。在一些示例中,热时长阈值可以是分钟级、小时级等,在此不做限定。例如,热度时长阈值可以是3分钟、4分钟、1小时、3小时等。可以理解的是,热度时长阈值越短,将目标热点信息判定为非存活的热点信息的耗时越短,由此,可以更快判定热点信息失效而将热点信息的第一状态切换为第二状态,提高判定效率以及对热点信息的热点生命周期的跟踪实时性;而热度时长阈值越长,若要将目标热点信息判定为非存活的热点信息,所需耗费的时间越长,可以有效降低误判率。

在一些实施方式中,在热度特征不满足推送条件时,判断持续时间长度是否达到热度时长阈值的具体实施方式可以为:在热度特征不满足推送条件时,判断热度时长阈值后目标热点信息的热度特征是否满足热度条件;若热度时长阈值后目标热点信息的热度特征满足热度条件,判定持续时间长度达到热度时长阈值。在热度特征不满足推送条件时,可间隔热度时长阈值再获取目标热点信息的热度特征,并判断目标热点信息的热度特征是否仍满足推送条件,若仍满足,可判定持续时间长度达到热度时长阈值,以确定目标热点信息失效,服务器将目标热点信息的第一状态切换为第二状态。由此,可避免因热度特征短暂地不满足推送条件而带来的误判,提高对热点信息是否存活的判别准确率。

在一些实施方式中,热度时长阈值可以是热度增长周期的整数倍,此时若持续时间长度达到热度时长阈值,即目标热点信息在连续多个热度增长周期中的每个热度特征均不满足推送条件。例如,整数倍可以是1倍、2倍、3倍等,若整数倍为2倍,热度时长阈值为两个热度增长周期,目标热点信息在连续2个热度增长周期的热度特征均需不满足推送条件,才可判定持续时间长度达到热度时长阈值。由此,通过在热度特征不满足推送条件时,判断持续时间长度是否达到热度时长阈值,可使得若要将目标热点信息的第一状态切换为第二状态,至少需要花费热度增长周期的整数倍的时长。

在一些实施方式中,若整数倍越小,热度时长阈值越短,此时在保证内容分发准确性的情况下,还可提高对热点信息是否存活的判定效率,及时发现目标热点信息非存活,及时更新热点信息的第一状态为第二状态,从而达到更高的跟踪实时性。在一些实施例中,当热度特征的特征指包括搜索频率时,若搜索频率超过热度频率时,可判定热度特征不满足推送条件,此时可判断持续时间长度是否达到指定时间阈值热度时长阈值。在其他一些实施例中,热度特征也可包括搜索次数或搜索频率排名等,判定方式与前述类似,在此不再赘述。

在另一些实施例中,热度特征的特征值也可以包括搜索频率以及搜索频率增长率,具体实施方式可见后述实施例,在此不再赘述。

于本实施例中,判断持续时间长度是否达到热度时长阈值之后,还包括:

若持续时间长度达到热度时长阈值,可执行s640;

若持续时间长度未达到热度时长阈值,可执行s650。

s640:将目标热点信息的第一状态切换为第二状态。

s650:将目标热点信息作为存活的热点信息。

s660:根据处于第一状态的热点信息,确定推送的内容。

另外,在一些实施例中,当热度特征的特征值包括搜索频率以及搜索频率增长率时,判断搜索频率是否超过热度频率之后,还可在超过时继续判断搜索频率是否大幅降低,在未超过时继续判断搜索频率是否大幅增长,由此在提高判别效率的同时,还可避免仅通过搜索频率的比较所导致的、将搜索频率处于快速增长期、但还未来得及超过热度频率的热点信息,以及将搜索频率处于快速下降期、但还未来得及在本周期下降至低于热度频率的热点信息误判为非存活,降低误判率。具体地,请参阅图8,示出了本申请实施例提供的一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s710至s770。

s710:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

s720:判断搜索频率是否超过指定频率。

s730:判断搜索频率增长率是否超过第一指定增长率。

s740:判断搜索频率增长率是否超过第二指定增长率。

s750:在热度特征满足指定条件时,判断持续时间长度是否达到热度时长阈值。

若判断搜索频率增长率未超过第一热度增长率,或若判断搜索频率增长率未超过第二热度增长率,可判定热度特征不满足推送条件,此时可判断持续时间长度是否达到热度时长阈值。

在一些实施例中,由于热度增长周期是根据多个热点信息的热度特征的增长时间确定的,若热度时长阈值过小,小于热度增长周期,可能热点信息的搜索频率还未来得及累计达到热度频率前,就误判热点信息为非存活的热点信息,误将热点信息的第一状态切换为第二状态,使得向用户推送内容时遗漏了部分热点内容,影响内容分发效果,因此通过将热度时长阈值设置为热度增长周期的整数倍,可提升内容分发的准确性。

于本实施例中,在热度特征不满足推送条件时,判断持续时间长度是否达到热度时长阈值之后,还包括:

若持续时间长度达到热度时长阈值,可执行s760;

若持续时间长度未达到热度时长阈值,可执行s770。

s760:将目标热点信息的第一状态切换为第二状态。

若持续时间长度达到热度时长阈值,将目标热点信息的第一状态切换为第二状态。

s770:根据处于第一状态的热点信息,确定推送的内容。

若持续时间长度未达到热度时长阈值,可不改变目标热点信息的状态,保持在第一状态,以使得该目标热点信息仍可继续被用于推送。

需要说明的是,上述步骤中未详细描述的部分,可参考前述实施例,在此不再赘述。

本实施例提供的信息推送方法,在前述方法实施例的基础上,判断搜索频率是否超过热度频率之后,还可在超过时继续判断搜索频率是否大幅降低,在未超过时继续判断搜索频率是否大幅增长,由此在提高判别效率的同时,还可降低误判率,避免仅通过搜索频率的比较所导致的、将搜索频率处于快速上升期、但还未来得及超过热度频率的热点信息误判为非存活,而将该热点信息的第一状态切换为第二状态,还可避免将搜索频率处于快速下降期、但还未来得及在本周期下降至低于热度频率的热点信息误判为存活,以避免推送实际上已过期或失效的热点信息所对应的内容。另外,通过在热度特征不满足推送条件时,判断持续时间长度是否达到热度时长阈值,并在达到时将目标热点信息的第一状态切换为第二状态,可有效降低误判率,提高内容分发的准确性。

另外,在一些实施例中,在判定热度特征是否满足推送条件时,还可通过热点信息的标志位作多次判定,以提高对热点信息的热点生命周期的跟踪准确性,降低误判率,从而提高内容分发的准确性。具体地,请参阅图9,示出了本申请实施例提供的一种信息推送方法,可应用于上述服务器,具体地,该方法包括:s810至s870。

s810:基于热度增长周期,获取处于第一状态的目标热点信息的热度特征。

s820:判断热度特征是否满足推送条件。

于本实施例中,判断热度特征是否满足推送条件之后,可包括:

在热度特征不满足推送条件时,可执行s830;

在热度特征满足推送条件时,可执行s870。

s830:获取目标热点信息的标志位。

其中,每个热点信息对应设置有一个标志位,标志位用于标记热点信息是无效还是有效,标志位可以为无效标志,也可以为有效标志。在前述实施例的基础上,可通过判断热度特征的一个特征或多个特征的组合是否达到指定值,来判定热度特征是否满足推送条件,在热度特征不满足推送条件时,获取目标热点信息的标志位。

s840:判断标志位是否为无效标志。

每个热点信息对应设置有一个标志位。在一个示例中,标志位用flag表示,flag=1对应有效标志,flag=0对应无效标志。

作为一种实施方式,判断标志位是否为无效标志的实施方式可以为:获取目标热点信息的标志位,若标志位flag=0,可判定标志位为无效标志;若标志位flag=1,可判定标志位为有效标志。

于本实施例中,判断标志位是否为无效标志后,还包括:

若标志位不为无效标志,为有效标志时,可执行s850;

若标志位为无效标志,可执行s860。

s850:更新目标热点信息的标志位为无效标志。

在热度特征不满足推送条件时,若目标热点信息的标志位为有效标志,可更新目标热点信息的标志位为无效标志。由此,在当前热度特征不满足推送条件时,可认为目标热点信息已超出其热点生命周期,然后若目标热点信息此前的标志位为有效标志,可更新标志位为无效标志,以便下次在热度特征不满足推送条件时,再作下一次判定,避免在确定推送的内容时,遗漏可能仍存活的热点信息,从而通过多次判定可降低误判率,提高内容分发准确性。

更新目标热点信息的标志位为无效标志后,可再次获取目标热点信息的热度特征,即返回执行s810。从而避免在一次判定标志位为无效标志时,就将目标热点信息的第一状态切换为第二状态,可有效降低误判率,避免向用户终端推送时,遗漏实际上仍存活的热点信息所对应的内容,可提高内容分发准确性。

在一种实施方式中,更新目标热点信息的标志位为无效标志后,可在热度判定周期之后再次获取目标热点信息的热度特征,以对热点信息是否满足推送条件进行多次判定。

其中,热度判定周期可以是程序设定的,也可以是用户自定义的。在一些示例中,热度判定周期可以是分钟级、小时级等,在此不做限定。例如,热度时长阈值可以是3分钟、4分钟、1小时、3小时等。

在一些实施例中,热度判定周期可以为热度增长周期的整数倍,由此,服务器可作多次判定,如二次、三次、四次判定等。

在一些实施方式中,若热度判定周期为热度增长周期的1倍,则服务器可作二次判定。此时,可分别获取连续两个热度增长周期中目标热点信息的标志位,在连续两次标志位均为无效标志时,可将目标热点信息的第一状态切换为第二状态。

在另一些实施方式中,若热度判定周期为热度增长周期的2倍,服务器可作三次判定。此时,获取连续三个热度增长周期中目标热点信息的标志位,在连续三次标志位均为无效标志时,可将目标热点信息的第一状态切换为第二状态。也就是说,三次判定是在前述二次判定的基础上,第二次获取目标热点信息的标志位为无效标志时,仍返回执行s810,并在第三次获取目标热点信息的标志位仍为无效标志时,才将目标热点信息的第一状态切换为第二状态并执行后续操作。

此外,通过将热度判定周期设置为热度增长周期的整数倍,可对目标热点信息的热度特征是否满足推送条件进行多次判定,原理与前述二次、三次判定类似,在此不再赘述。

s860:将目标热点信息的第一状态切换为第二状态。

在热度特征不满足推送条件时,若标志位为无效标志,将目标热点信息的第一状态切换为第二状态。由此,在当前热度特征不满足推送条件,可认为目标热点信息失效时,若目标热点信息此前的标志位为无效标志,相当于目标热点信息两次被判定为无效,此时,可将目标热点信息的第一状态切换为第二状态,而不对处于第二状态的热点信息进行推送,可有效降低误判率,避免过期推送,提高内容分发准确性。

s870:根据处于第一状态的热点信息,确定推送的内容。

需要说明的是,上述步骤中未详细描述的部分,可参考前述实施例,在此不再赘述。

请参阅图10,其示出了本申请实施例提供的一种信息推送装置的结构框图,该信息推送装置1000可以包括:特征获取模块1010、状态更新模块1020和热点推送模块1030。

特征获取模块1010,用于基于热度增长周期,获取目标热点信息的热度特征;

状态更新模块1020,用于在所述热度特征不满足推送条件时,将所述目标热点信息的第一状态切换为第二状态;

热点推送模块1030,用于根据处于所述第一状态的热点信息,确定推送的内容。

进一步地,在所述基于热度增长周期,获取处于第一状态的目标热点信息的热度特征之前,所述信息推送装置1000还包括:多热度获取模块、增长时间获取模块以及增长周期确定模块,其中:

多热度获取模块,用于获取多个热点信息的热度特征;

增长时间获取模块,用于获取每个所述热点信息的热度特征的增长时间,所述增长时间为热度特征的特征值达到热度阈值的时间;

增长周期确定模块,用于基于每个所述增长时间,确定所述热度增长周期。

进一步地,所述增长周期确定模块包括:第一周期确定子模块以及第二周期确定子模块,其中:

第一周期确定子模块,用于将每个所述增长时间中最长的增长时间,确定为所述热度增长周期。

第二周期确定子模块,用于基于每个所述增长时间,获取平均增长时间,并将所述平均增长时间确定为所述热度增长周期。

进一步地,所述特征获取模块1010包括:目标热点获取子模块以及热度特征获取子模块,其中:

目标热点获取子模块,用于获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息;

热度特征获取子模块,用于获取所述目标热点信息的热度特征;

进一步地,所述根据处于所述第一状态的热点信息,确定推送的内容之后,所述信息推送装置1000还包括:热点信息更新模块以及热度周期迭代模块,其中:

热点信息更新模块,用于将所述处于第一状态的热点信息作为下一热度增长周期内处于第一状态的热点信息;

热度周期迭代模块,用于若所述下一热度增长周期的周期数小于指定周期数,将所述下一热度增长周期作为当前热度增长周期,返回执行所述获取当前热度增长周期内处于第一状态的热点信息作为目标热点信息。

进一步地,所述热度特征的特征值包括搜索频率,状态更新模块1020包括:频率判断子模块以及频率状态子模块,其中:

频率判断子模块,用于判断所述搜索频率是否超过热度频率;

频率状态子模块,用于若所述搜索频率未超过热度频率,将所述目标热点信息的第一状态切换为第二状态。

进一步地,所述热度特征的特征值包括搜索频率以及搜索频率增长率,信息推送装置1000还包括:第一增长判断模块以及第一增长状态模块,其中:

第一增长判断模块,用于若所述搜索频率超过热度频率,判断所述搜索频率增长率是否超过第一热度增长率;

第一增长状态模块,用于若所述搜索频率增长率未超过第一热度增长率,将所述目标热点信息的第一状态切换为第二状态。

进一步地,所述热度特征的特征值包括搜索频率以及搜索频率增长率,频率状态子模块包括:第二增长判断模块以及第二增长状态模块,其中:

第二增长判断模块,用于若所述搜索频率未超过热度频率,判断所述搜索频率增长率是否超过第二热度增长率;

第二增长状态模块,用于若所述搜索频率增长率未超过第二热度增长率,将所述目标热点信息的第一状态切换为第二状态。

进一步地,状态更新模块1020包括:持续时间子模块以及持续状态子模块,其中:

持续时间子模块,用于在所述热度特征不满足推送条件时,判断持续时间长度是否达到热度时长阈值,其中,所述持续时间长度为所述热度特征持续不满足推送条件的时间长度;

持续状态子模块,用于若所述持续时间长度达到热度时长阈值,将所述目标热点信息的第一状态切换为第二状态。

进一步地,持续时间子模块包括:时间阈值判断单元以及时间阈值判定单元,其中:

时间阈值判断单元,用于在所述热度特征不满足推送条件时,判断在热度时长阈值之后,所述目标热点信息的热度特征是否满足热度条件;

时间阈值判定单元,用于若在热度时长阈值之后,所述目标热点信息的热度特征不满足推送条件,判定所述持续时间长度达到热度时长阈值。

进一步地,所述热度时长阈值为所述热度增长周期的整数倍。

进一步地,状态更新模块1020包括:标志获取子模块、第一标志子模块以及第二标志子模块,其中:

标志获取子模块,用于在所述热度特征不满足推送条件时,获取所述目标热点信息的标志位;

第一标志子模块,用于若所述标志位为有效标志,更新所述目标热点信息的标志位为无效标志;

第二标志子模块,用于若所述标志位为无效标志,将所述目标热点信息的第一状态切换为第二状态。

进一步地,所述若所述标志位为有效标志,更新所述目标热点信息的标志位为无效标志之后,信息推送装置1000还包括:再次获取模块以及再次更新模块,其中:

再次获取模块,用于再次获取所述目标热点信息的热度特征;

再次更新模块,用于若再次获取的热度特征满足热度条件,将所述目标热点信息的第一状态切换为第二状态。

进一步地,所述再次获取模块包括:再次获取子模块,用于在热度判定周期之后再次获取所述目标热点信息的热度特征。

进一步地,所述热度判定周期为所述热度增长周期的整数倍。

本申请实施例提供的信息推送装置用于实现前述方法实施例中相应的信息推送方法,并具有相应的方法实施例的有益效果,在此不再赘述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。

另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

请参考图11,其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备1100可以是服务器等能够运行应用程序的电子设备。本申请中的电子设备1100可以包括一个或多个如下部件:处理器1110、存储器1120、以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器1120中并被配置为由一个或多个处理器1110执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。

处理器1110可以包括一个或者多个处理核。处理器1110利用各种接口和线路连接整个电子设备1100内的各个部分,通过运行或执行存储在存储器1120内的指令、程序、代码集或指令集,以及调用存储在存储器1120内的数据,执行电子设备1100的各种功能和处理数据。可选地,处理器1110可以采用数字信号处理(digitalsignalprocessing,dsp)、现场可编程门阵列(field-programmablegatearray,fpga)、可编程逻辑阵列(programmablelogicarray,pla)中的至少一种硬件形式来实现。处理器1110可集成中央处理器(centralprocessingunit,cpu)、图像处理器(graphicsprocessingunit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1110中,单独通过一块通信芯片进行实现。

存储器1120可以包括随机存储器(randomaccessmemory,ram),也可以包括只读存储器(read-onlymemory)。存储器1120可用于存储指令、程序、代码、代码集或指令集。存储器1120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备1100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

则如果上述图10所示的信息推送装置中的各个单元作为程序包等函数模块的话,该信息推送装置内的各个单元存储在存储器1120内,能够被处理器调用,并执行对应的功能。

请参考图12,其示出了本申请实施例提供的一种计算机可读取存储介质的结构框图。该计算机可读取存储介质1200中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读取存储介质1200可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读取存储介质1200包括非易失性计算机可读介质(non-transitorycomputer-readablestoragemedium)。计算机可读取存储介质1200具有执行上述方法中的任何方法步骤的程序代码1210的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1210可以例如以适当形式进行压缩。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1