基于预读取的页面热点资源更新方法和装置制造方法

文档序号:6514442阅读:126来源:国知局
基于预读取的页面热点资源更新方法和装置制造方法
【专利摘要】本发明公开了一种基于预读取的页面热点资源更新方法和装置,其中的方法包括:根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H;根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
【专利说明】基于预读取的页面热点资源更新方法和装置
【技术领域】
[0001]本发明涉及网络访问技术,具体涉及基于预读取的页面热点资源更新方法和装置。
【背景技术】
[0002]用户在使用浏览器(如搜狗高速浏览器)访问网站过程中,往往会因为网站的服务能力、用户的带宽以及访问网页内容的大小等多种因素,而导致该网站网页的打开速度较慢,从而影响了用户的上网体验。
[0003]目前,可以采用预读取方法来提高网站访问速度,即提前获取相应网页对应的资源,并本地缓存这些资源,当用户真正去访问这些网页时,只需从本地缓存中读取相应的资源即可,从用户角度而言,该方法提高了网站网页的打开速度,从而提高了用户体验。
[0004]发明人在实现本发明过程中发现,在现有的预读取方法中,准确的预测用户会访问哪些网页是非常重要的,如何准确的预测用户会访问哪些网页,以不断改善用户的网络访问体验,是一个需要持续关注的课题。

【发明内容】

[0005]本发明的目的在于,克服现有的预读取方法存在的技术问题,而提供一种针对移动设备的基于预读取的页面热点资源更新方法和装置,所要解决的技术问题是,保证预读取的高准确性和高有效性,以提高用户体验。
[0006]本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
[0007]依据本发明提出的一种基于预读取的页面热点资源更新方法,其中,所述方法包括:根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H ;根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
[0008]可选的,上述基于预读取的页面热点资源更新方法,其中,所述方法在更新所述累积热度N以及热度H之后还包括:根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
[0009]可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息的步骤包括:实时获取各终端设备的网络访问的客户端日志;从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
[0010]可选的,上述基于预读取的页面热点资源更新方法,其中,所述方法在更新所述累积热度N以及热度H之前还包括:对所述链接对信息进行过滤的步骤,且所述过滤的步骤包括:根据所述链接对信息确定点出页的类型;滤除出点出页的类型属于预定类型的链接对信息。
[0011]可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括:在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
[0012]可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括:在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;其中,所述热度H根据热度衰减周期定期恢复为初始值。
[0013]可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理的步骤包括:根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;N=NXXXA ;其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
[0014]可选的,上述基于预读取的页面热点资源更新方法,其中,所述根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理的步骤包括:根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;N = NXYX (H/H’ ) X (N’ /H’ );其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
[0015]依据本发明提出的一种基于预读取的页面热点资源更新装置,其中,该装置包括:获取模块,用于根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息;第一更新模块,用于根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H ;热度衰减模块,用于根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理;第二更新模块,用于根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
[0016]可选的,上述基于预读取的页面热点资源更新装置,其中,所述装置还包括:时间衰减模块,与第一更新模块连接,用于根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。[0017]可选的,上述基于预读取的页面热点资源更新装置,其中,所述获取模块具体用于:实时获取各终端设备的网络访问的客户端日志,并从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
[0018]可选的,上述基于预读取的页面热点资源更新装置,其中,所述装置还包括:过滤模块,与所述获取模块和第一更新模块分别连接,且所述过滤模块用于根据所述链接对信息确定点出页的类型,并滤除出点出页的类型属于预定类型的链接对信息。
[0019]可选的,上述基于预读取的页面热点资源更新装置,其中,所述第一更新模块具体用于:在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储;将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值;将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
[0020]可选的,上述基于预读取的页面热点资源更新装置,其中,所述第一更新模块具体用于:在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;其中,所述热度H根据热度衰减周期定期恢复为初始值。
[0021]可选的,上述基于预读取的页面热点资源更新装置,其中,所述时间衰减模块具体用于:根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理;N=NXXXA ;其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
[0022]可选的,上述基于预读取的页面热点资源更新装置,其中,所述热度衰减模块具体用于:根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理;N = NXYX (H/H’ ) X (N’ /H’ );其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
[0023]借由上述技术方案,本发明提供的针对移动设备的基于预读取的页面热点资源更新方法和装置至少具有下列优点及有益效果:本发明实施例通过获取各网络访问的来源地址与点出页地址的链接对信息,并根据该链接对信息对点出页的累积热度N进行时间衰减处理以及热度衰减处理,使各点出页的累积热度N可以准确的反应各点出页的用户的消费趋势,这样,在向用户基于预读取进行页面推送时,通过参考各点出页的累积热度N,可以使服务端提前向用户推送的页面被用户选中点击的命中概率会大大提高,进而保证了预读取的闻准确性和闻有效性,最终提闻了用户体验。
[0024]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。
【专利附图】

【附图说明】
[0025]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]图1是本发明实施例提供的基于预读取的页面热点资源更新方法流程图;
[0027]图2是本发明实施例提供的基于预读取的页面热点资源更新装置示意图。
【具体实施方式】
[0028]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0029]实施例一、基于预读取的页面热点资源更新方法。该更新方法的流程如图1所示。
[0030]图1中,S100、根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息。
[0031]具体的,本发明实施例可以通过各终端设备的网络访问的客户端日志实时的获取到上述链接对信息;该网络访问的客户端日志通常是由终端设备的浏览器客户端产生的。该终端设备可以为台式计算机、笔记型计算机、平板电脑以及智能型移动电话等可以通过客户端浏览器进行网络访问的终端设备。
[0032]本步骤的一个具体的例子,服务器可以通过构建后台服务端来实时获取网络中的所有终端设备的网络访问的客户端日志,该客户端日志中记录有用户通过客户端进行网络访问的浏览路径,从而服务器(如服务器的后台服务端)可以从上述实时获得的网络访问的客户端日志的浏览路径中提取出网络访问的来源地址以及针对该来源地址的点出页地址,从而获得上述链接对信息。
[0033]上述获取的链接对信息可以具体包括:来源地址以及针对该来源地址的点出页地址,且该链接对信息可以使用Refer->Url信息来表示,其中,Refer表示来源地址,而Url表示针对该来源地址的点出页地址。
[0034]S110、根据获取的各链接对信息更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
[0035]具体的,本发明实施例可以在获取到链接对信息之后,先对获取到的链接对信息进行过滤处理,然后,再利用过滤处理后的链接对信息对累积热度N以及热度H进行更新处理。
[0036]对获取到的链接对信息进行过滤的目的包括:避免一些不需要向用户提前推送的网页对应的链接对信息对本发明实施例中的页面热点资源更新的影响。
[0037]本发明实施例对上述SlOO中获得的链接对信息进行过滤的一个具体实现方式为:根据链接对信息中的来源地址以及点出页地址判断链接对的点出页的类型,如果判断出点出页的类型属于需要进行滤除的预定类型,则滤除该链接对信息,否则,保留该链接对信息。
[0038]上述需要进行滤除的预定类型可以包括:不可预读取类型、信息含量少类型以及具有破坏性功能类型等。上述不可预读取类型可以包括广告类型等;上述信息含量少类型可以包括微博类型等;上述具有破坏性功能类型可以包括用户登录类型等。[0039]广告类型的点出页的特点可以为:链接对信息中通常包含有类似“www.alimama.com”这样的特征信息,从而在判断出链接对信息中包含有类似“www.al imama.com”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
[0040]信息含量少类型的点出页的特点可以为:链接对信息中通常包含有类似“weibo”这样的特征信息,从而在判断出链接对信息中包含有类似“weibo”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
[0041]用户登录类型的点出页的特点可以为:链接对信息中通常包含有类似“login”、“logout”以及“account=”这样的特征信息,从而在判断出链接对信息中包含有类似“login”、“logout”或者“account=”这样的特征信息时,可以确定出该链接对信息属于应被滤除的链接对信息。
[0042]本发明实施例可以利用预先设定的过滤模板对上述S100中获得的链接对信息进行过滤处理。
[0043]在本发明实施例包含有上述过滤处理操作的情况下,应利用过滤处理后的链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,而不是利用S100中获取到的所有链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
[0044]在本发明实施例不包含有上述过滤处理操作的情况下,应直接利用S100中获取到的所有链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H。
[0045]不论本发明实施例是利用过滤处理后的链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,还是利用S100中获取到的所有链接对信息来更新链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H,都可以采用下述更新处理方式,SP:
[0046]针对每一条链接对信息,分别判断链接对信息中的点出页地址是否为针对该链接对信息中的来源地址的一个新的点出页地址(即该点出页地址是否已存在于之前记录的该来源地址下的各点出页地址中),如果是一个新的点出页地址,则针对该新的点出页地址执行下述第一操作;如果不是一个新的点出页地址,则针对该新的点出页地址执行下述第二操作。
[0047]第一操作:存储该点出页地址,并将该点出页地址的访问时间作为该点出页地址的第一次被访问的时间存储;同时,将该点出页地址的累积热度N设置为在N的初始值的基础上根据第一预定步长的递增值,如N=NWMt+l ;将该点出页在过去预定时长的时间窗内的热度H设置为在H的初始值的基础上根据第二预定步长的递增值,如H=HWMt+l,该热度H可以表示出在过去预定时长的时间窗内该点出页被点击的次数。上述Nw可以设置为0,且上述Hwmi也可以设置为O。当然,上述第一预定步长和第二预定步长也可以不为1,且上述和Hwmi也可以为除0之外的其他数值。
[0048]第二操作:根据第一预定步长使该链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,如N=N3IMt+l ;根据第二预定步长使链接对信息所属的链接对的点出页在过去预定时长的时间窗内的热度H在当前热度数值的基础上递增,如H=Hstm+l ;当然,这里的第一预定步长和第二预定步长也可以不为I。上述点出页的累积热度N通常并不会周期性的被恢复为初始值(即Nw,如0),然而,上述热度H应根据热度衰减周期定期恢复为初始值(即Hw,如0),即上述时间窗的预定时长为热度衰减周期的时长。另外,上述热度衰减周期的时长(即时间窗的预定时长)的取值可根据实际需求以及服务器的计算能力等进行设置,如设置为I分钟或者设置为5分钟等。
[0049]本发明实施例可以针对一个来源地址设置一个列表,该列表可以称为页面热点资源列表,该页面热点资源列表中可以主要包括:针对来源地址的时间衰减因子、针对来源地址的热度衰减因子、点出页地址、点出页地址的累积热度N、点出页在过去预定时长的时间窗内的热度H以及点出页地址第一次被访问的时间。当然,该页面热点资源列表中还可以包括其他内容,如来源地址的热度以及在该列表中所记录的来源地址下的点出页的数量等。另外,本发明实施例也可以针对多个来源地址设置一个页面热点资源列表,此时,该列表中还应包括来源地址这一项。
[0050]需要说明的是,对于新的点出页地址而言,其出现的时间可能是在当前时间窗的中间位置或者中间偏后的位置,因此,在当前时间窗(即针对新的点出页地址的第一个时间窗内),新的点出页的累积热度N以及热度H的数值大小可能会偏低,在进入下一个时间窗(即针对新的点出页地址的第二个时间窗)后,其累积热度N以及热度H的数值大小很可能会逐步提闻。
[0051]S120、根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理。
[0052]具体的,上述S120中还可以包含有根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理,本发明实施例对这两个衰减处理操作的先后执行顺序并不进行特殊限定;且上述时间衰减周期和热度衰减周期的时长可以相同,也可以不相同,用户可以根据实际需求灵活设置上述时间衰减周期和热度衰减周期的时长。需要说明的是,由于热度衰减周期的时长应为上述时间窗的预定时长,因此,在根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减后,热度H被恢复为初始值,如O。
[0053]页面热点资源具有的一个特点为:随着时间的推移,页面热点资源会呈现出降温的趋势,且老的页面热点资源由于已经累积了一定的热度,因此,老的页面热点资源的降温趋势会比新的页面热点资源的降温趋势更明显;本发明实施例对累积热度N进行时间衰减即是针对页面热点资源的这一特点设计的。
[0054]页面热点资源具有的另一个特点为:针对新出现的页面热点资源,如果一开始热度就很高,那么其热的趋势会继续上升,该页面热点资源会快速上升到一定的热度;对于老的页面热点资源,如果热度开始降低,那么其热的趋势会继续下降,该页面热点资源会快速下降出一定的热度区域。另外,通过进行热度的平均可以平衡短暂内热门的页面热点资源的所出现的波动现象。本发明实施例对累积热度N进行热度衰减即是针对页面热点资源的这一特点设计的。
[0055]根据时间衰减周期利用针对来源地址的时间衰减因子对累积热度N进行时间衰减处理的一个具体例子为:周期性(基于时间衰减周期)的利用下述公式(I)计算累积热度N在时间衰减处理操作后的数值;[0056]N=NX X XT/Now ; 公式(I)
[0057]在上述公式(I)中,X为时间衰减因子,T为链接对信息中的点出页第一次被访问的时间,Now为当前时间(如服务器当前时间),上述第一次被访问的时间以及当前时间均可以包括:年、月、日、小时、分钟以及秒,如第一次被访问的时间以及当前时间均可以采用格林威治时间表示方法,格林威治时间表示方法的一个具体例子:1970年I月I日00:00:00。
[0058]由于上述T的取值为固定值,而Now的取值会不断增加,因此,时间衰减体现的是基于当前时间的倒数的曲线,由此可知,上述T/Now也可采用对数、指数、开方或者幂等多种数学形式,其区别在于:曲线的变化速率不同。
[0059]根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对累积热度N进行在时间窗内的热度衰减处理的一个具体的例子为:周期性的利用下述公式(2)计算累积热度N在时间窗内的热度衰减处理后的数值;
[0060]N = NXYX (H/H,)X (N,/H,); 公式(2)
[0061]在上述公式(2)中,Y为热度衰减因子,H’为所有属于同一个来源地址的点出页
在同一时间窗内的的热度H的平均值,即n为属于同一个来源地址的所有点
出页的数量;N’表示一个点出页地址在其存储的时间段内单位时间的热度值,如N’ =N/(Now-T+1);上述H/H’可以描述为:一个点出页地址的热度如果高于上述平均值,且高出的程度越高,则H/H’所表示出来的系数越大,相反,如果低于上述平均值,且低出的程度越低,则H/H’所表示出来的系数越小。考虑到一个点出页在某些时间窗内的热度H可能很低,这样会造成曲线的波动很大,因此,上述N’ /H’中的单位时间的热度值N’可以起到平滑曲线的作用,具体的,由于用户的访问时间的不可控等因素很可能会使H在某一时间窗内的计算结果产生非常大的变化,因此,本发明实施例通过利用点出页地址在其存储的时间段内单位时间的热度值N’来平衡H,可以避免H在某一时间窗内的计算结果具有非常大的变化,从而使相应的曲线表现的更趋平滑。
[0062]同理,由于上述T的取值为固定值,而Now的取值会不断增加,因此,热度衰减体现的是基于当前时间的倒数的曲线,从而上述H/H’以及N’/H’也可采用对数、指数、开方或者幂等多种数学形式,其区别在于:曲线的变化速率不同。
[0063]上述时间衰减因子X和热度衰减因子Y可以是通过对客户端日志进行数据挖掘后而设置的,对不同的来源地址(Refer)配置的时间衰减因子X和热度衰减因子Y通常并不相同:一个具体的例子,对于变化更新比较快的来源地址(如http://www.sina.com, cn/以及http://www.sohu.com/等),所设置的时间衰减因子X和热度衰减因子Y的取值,应与对于变化更新比较慢的来源地址(如http://www.soRou.com/等)所设置的时间衰减因子X和热度衰减因子Y的取值具有比较明显的差别。且对于一个点出页地址而言,针对其来源地址的时间衰减因子X和针对其来源地址的热度衰减因子Y—旦确定通常不会再发生变化。
[0064]S130、根据衰减处理结果更新相应链接对的点出页的累积热度N。
[0065]具体的,本发明实施例可以根据上述衰减处理后获得的N更新页面热点资源列表中的相应链接对的点出页的累积热度N,并可以按照该积累热度N由大到小的顺序对列表中的点出页进行重新排序,从而在向用户基于预读取进行页面推送时,可以参考当前页面热点资源列表,由于该列表可以准确的反应各点出页的消费趋势,因此,在预读取过程中,提前推送的页面被用户选中点击的命中概率会被大大提高,从而提高了用户的体验。当然,本发明实施例也可以不对该列表进行重新排序,而是将一个来源地址下的各点出页地址提取出来放在一个新的列表中,且在该新的列表中,各点出页地址是按照点出页的累积热度N由大到小的顺序依次排列的。
[0066]实施例二、基于预读取的页面热点资源更新方法的一个具体实例。
[0067]在本实施例中,来源地址(下述用Refer表示)为新浪国际足球的网页地址,即http://sports, sina.com.cn/global/,并使用 Url 来表示针对 Refer 的点出页地址。
[0068]云端服务器的服务端实时收集网络中所有用户的客户端浏览器在http://sports, sina.com.cn/global/上的点击信息,从而产生链接对信息(refer, url);服务端收
集的链接对信息如下:
[0069]
【权利要求】
1.一种基于预读取的页面热点资源更新方法,其特征在于,该方法包括: 根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息; 根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H ; 根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理; 根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
2.如权利要求1所述的方法,其特征在于,所述方法在更新所述累积热度N以及热度H之后还包括: 根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
3.如权利要求1所述的方法,其特征在于,所述根据各终端设备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息的步骤包括: 实时获取各终端设备的网络访问的客户端日志; 从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
4.如权利要求1所述的方法,其特征在于,所述方法在更新所述累积热度N以及热度H之前还包括:对所述链接对信息进行过滤的步骤,且所述过滤的步骤包括: 根据所述链接对信息确定点出页的类型; 滤除出点出页的类型属于预定类型的链接对信息。
5.如权利要求1所述的方法,其特征在于,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括: 在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储; 将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值; 将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
6.如权利要求1所述的方法,其特征在于,所述根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H的步骤包括: 在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增;其中,所述热度H根据热度衰减周期定期恢复为初始值。
7.如权利要求2求所述的方法,其特征在于,所述根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理的步骤包括: 根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理; N=NXXXA ; 其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
8.如权利要求1至7中任一权利要求所述的方法,其中,所述根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理的步骤包括: 根据热度衰减周期利用下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理; N = NXYX (H/H,) X (N,/H,); 其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
9.一种基于预读取的页面热点资源更新装置,其特征在于,该装置包括: 获取模块,用于根据各终端设 备进行网络访问的信息获取各网络访问的来源地址与点出页地址的链接对信息; 第一更新模块,用于根据所述链接对信息更新所述链接对信息所属的链接对的点出页的累积热度N以及点出页在过去预定时长的时间窗内的热度H ; 热度衰减模块,用于根据热度衰减周期利用热度H和针对来源地址的热度衰减因子对所述累积热度N进行在所述时间窗内的热度衰减处理; 第二更新模块,用于根据所述衰减处理结果更新相应链接对的点出页的累积热度N,所述累积热度N为选取向终端设备提前推送资源的一个参数。
10.如权利要求9所述的装置,其特征在于,所述装置还包括: 时间衰减模块,与第一更新模块连接,用于根据时间衰减周期利用针对来源地址的时间衰减因子对所述累积热度N进行时间衰减处理。
11.如权利要求9所述的装置,其特征在于,所述获取模块具体用于:实时获取各终端设备的网络访问的客户端日志,并从所述网络访问的客户端日志中获取各网络访问的来源地址与点出页地址的链接对信息。
12.如权利要求9所述的装置,其特征在于,所述装置还包括: 过滤模块,与所述获取模块和第一更新模块分别连接,且所述过滤模块用于根据所述链接对信息确定点出页的类型,并滤除出点出页的类型属于预定类型的链接对信息。
13.如权利要求9所述的装置,其特征在于,所述第一更新模块具体用于: 在所述获取的链接对信息中的点出页地址为之前未曾存储的点出页地址的情况下,存储该未曾存储的点出页地址,并将所述未曾存储的点出页地址的访问时间作为第一次被访问的时间存储; 将所述之前未曾存储的点出页地址的累积热度N设置为在累积热度N的初始值的基础上根据第一预定步长的递增值; 将所述之前未曾存储的点出页地址的热度H设置为在热度H的初始值的基础上根据第二预定步长的递增值。
14.如权利要求9所述的装置,其特征在于,所述第一更新模块具体用于: 在所述获取的链接对信息中的点出页地址为之前曾记录的点出页地址的情况下,根据第一预定步长使所述链接对信息所属的链接对的点出页的累积热度N在当前累积热度数值的基础上递增,根据第二预定步长使所述链接对信息所属的链接对的点出页的热度H在当前热度数值的基础上递增; 其中,所述热度H根据热度衰减周期定期恢复为初始值。
15.如权利要求10所述的装置,其特征在于,所述时间衰减模块具体用于: 根据时间衰减周期利用下述公式对所述累积热度N进行时间衰减处理; N=NXXXA ; 其中,所述X为针对来源地址的时间衰减因子,所述A为基于T/Now的时间倒数曲线,所述T为链接对信息中的点出页第一次被访问的时间,所述Now为当前时间。
16.如权利要求9至15中任一权利要求所述的装置,其特征在于,所述热度衰减模块具体用于: 根据热度衰减周期利用 下述公式对所述累积热度N进行在所述时间窗内的热度衰减处理; N = NXYX (H/H,) X (N,/H,); 其中,所述Y为针对来源地址的热度衰减因子,所述H’为所有属于同一个来源地址的点出页在同一时间窗内的热度H的平均值,所述N’为链接对信息中的点出页地址在其被存储时间段内,单位时间的热度值。
【文档编号】G06F17/30GK103500213SQ201310461879
【公开日】2014年1月8日 申请日期:2013年9月30日 优先权日:2013年9月30日
【发明者】罗兴, 汤传喜, 胡又欢, 郭奇 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1