基于预读取的资源预置方法和装置制造方法

文档序号:7772768阅读:165来源:国知局
基于预读取的资源预置方法和装置制造方法
【专利摘要】本发明公开了一种基于预读取的资源预置方法和装置,其中的方法主要包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。本发明提供的上述技术方案大幅度提升了用户访问常用网络资源的速度,从而进一步提升了用户的网络访问体验。
【专利说明】基于预读取的资源预置方法和装置
【技术领域】
[0001]本发明涉及网络访问技术,具体涉及基于预读取的资源预置方法和装置。
【背景技术】
[0002]用户在使用浏览器(如搜狗高速浏览器)进行网络访问过程中,往往会因为网站的服务器处理能力、用户的网络带宽以及所访问网页内容的大小等多种因素,而导致该网站网页的打开速度较慢,从而影响了用户的上网体验。
[0003]现有的一种提高网站访问速度的方法为:服务器对用户访问网站的热点部分进行计算,以预测出热点资源,服务器获取热点资源对应的页面内容,并将该页面内容推送给终端设备,终端设备本地缓存该页面内容,如终端设备将该页面内容缓存在本地内存中;这样,当用户真正去访问服务器提前推送来的页面内容时,终端设备只需从本地缓存中读取相应的页面内容即可。
[0004]从用户角度而言,上述方法提高了网站网页的打开速度,从而提高了用户的网络访问体验。由于上述方法是终端设备提前从服务器处获取了相应的信息,因此,上述方法可以称为预读取方法。
[0005]发明人在实现本发明过程中发现,随着互联网技术的迅速发展,网络访问量随之不断的增加,预读取技术也就显的越来越重要了。而针对预读取技术而言,如何为用户提前提供其真正所需的网络资源,并不断提升用户的网络访问速度和体验,是一个需要持续关注的课题。

【发明内容】

[0006]本发明的目的在于,克服现有的预读取方法所存在的技术问题,提供一种基于预读取的资源预置方法和装置,所要解决的技术问题是,进一步提升用户的网络访问速度。
[0007]本发明的目的以及解决其技术问题可以采用以下的技术方案来实现。
[0008]依据本发明提出的一种基于预读取的资源预置方法,其中,所述方法包括:获取各站点下的资源的标识,所述标识唯一表示一个资源;根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。
[0009]可选的,上述基于预读取的资源预置方法,其中,所述根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理包括:针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包;针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包;且所述根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包包括:根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。
[0010]可选的,上述基于预读取的资源预置方法,其中,所述获取各站点下的资源的标识的步骤包括:获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。
[0011]可选的,上述基于预读取的资源预置方法,其中,所述对各资源对应的原始文件进行筛选处理的步骤包括:滤除原始文件中包含有cookie设置信息的资源;和/或,滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或,滤除原始文件异常的资源。
[0012]可选的,上述基于预读取的资源预置方法,其中,所述方法在打包的步骤之前还包括:依据资源的权重值从筛选后的资源中选取相应的资源;且所述筛选处理后的资源为从筛选后的资源中选取的资源。
[0013]可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值是根据资源使用户重视的程度而设定的。
[0014]可选的,上述基于预读取的资源预置方法,其中,
[0015]所述资源的权重值根据Weight (resurl )=Uv (resurl)/Size (resurl)计算获得;其中,we迎ht (resurl)为资源的权重值,resurl为资源的URL, uv (resurl)为资源在过去预定时长的时间窗内的用户使用量,size (resurl)为资源的大小。
[0016]可选的,上述基于预读取的资源预置方法,其中,所述站点资源包的打包操作包括:针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包;其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。
[0017]可选的,上述基于预读取的资源预置方法,其中,所述方法还包括:根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包;向用户下发所述通用包;其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。
[0018]可选的,上述基于预读取的资源预置方法,其中,所述根据用户的网络访问特征为各用户分别选取站点资源包的步骤包括:
[0019]获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{ E (P(Sitei))I且E size (Sitei) +size (common) <Size (threshold)选取需要向用户下发的站点资源包;其中,Sitei为用户访问过的第i个站点,P(Sitei)为用户访问过的第i个站点的访问权重,size (Sitei)为用户访问过的第i个站点对应的站点资源包的大小,size(common)为通用包的大小,size (threshold)为客户端设定的下发包的大小。
[0020]可选的,上述基于预读取的资源预置方法,其中,所述下发的步骤还包括:根据前一次向用户下发的资源包的缓存时间向用户再次下发相应类型的资源包。
[0021]依据本发明实施例提供的一种基于预读取的资源预置装置,其中,该装置包括:
[0022]获取模块,用于获取各站点下的资源的标识,所述标识唯一表示一个资源;
[0023]筛选模块,用于根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源;
[0024]打包模块,用于根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理;
[0025]下发模块,用于根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。
[0026]可选的,上述基于预读取的资源预置装置,其中,所述打包模块具体包括:
[0027]公用资源打包子模块,用于针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包;
[0028]站点资源打包子模块,用于针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包;
[0029]且所述下发模块具体用于:
[0030]根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。
[0031]可选的,上述基于预读取的资源预置方法,其中,所述获取模块具体用于:获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。
[0032]可选的,上述基于预读取的资源预置方法,其中,所述筛选模块具体用于:滤除原始文件中包含有cookie设置信息的资源;和/或,滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或,滤除原始文件异常的资源。
[0033]可选的,上述基于预读取的资源预置方法,其中,所述装置还包括:选取模块,与筛选模块和打包模块分别连接,用于依据资源的权重值从筛选后的资源中选取相应的资源;且所述筛选处理后的资源为从筛选后的资源中选取的资源。
[0034]可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值是根据资源使用户重视的程度而设定的。
[0035]可选的,上述基于预读取的资源预置方法,其中,所述资源的权重值根据Weight(resurl) =Uv (resurl) /Size (resurl)计算获得;其中,Weight (resurl)为资源的权重值,resurl为资源的URL, Uv (resurl)为资源在过去预定时长的时间窗内的用户使用量,Size (resurl)为资源的大小。
[0036]可选的,上述基于预读取的资源预置方法,其中,所述站点资源打包子模块具体用于:针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包;其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。
[0037]可选的,上述基于预读取的资源预置方法,其中,所述装置还包括:通用包打包模块,用于根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包;且所述下发模块还用于向用户下发所述通用包;其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。
[0038]可选的,上述基于预读取的资源预置方法,其中,所述下发模块具体用于:
[0039]获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{ E (P(Sitei)M且E size (Sitei) size (common) < Size (threshold)选取需要向用户下发的站点资源包;
[0040]其中,Sitei为用户访问过的第i个站点,p Csitei)为用户访问过的第i个站点的访问权重,size (Sitei)为用户访问过的第i个站点对应的站点资源包的大小,size(common)为通用包的大小,Size (threshold)为客户端设定的下发包的大小。
[0041]可选的,上述基于预读取的资源预置方法,其中,所述下发模块还用于:根据前一次向用户下发的资源包的缓存时间向用户再次下发相应类型的资源包。
[0042]借由上述技术方案,本发明提供的基于预读取的资源预置方法和装置至少具有下列优点及有益效果:本发明实施例通过针对筛选处理后的资源进行打包(如公用资源包打包以及站点资源包打包),并根据用户的网络访问特征为各用户分别选取资源包(如站点资源包),向用户下发其所需的资源包(如站点资源包);进一步的,通过向用户下发公用资源包,避免了被各站点所引用的公用资源重复向用户下发的现象,且可以向用户下发更多可能被用户使用的其他资源(如站点资源包以及通用资源包等)。即本发明实施例提供的技术方案大幅度的提升了用户访问常用网络资源的速度,从而进一步提升了用户的网络访问体验。
[0043]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述以及其他目的、特征和优点能够更明显易懂,以下特举较佳的实施例,详细说明如下。
【专利附图】

【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1是本发明实施例提供的基于预读取的资源预置方法流程图;
[0046]图2是本发明实施例提供的基于预读取的资源预置方法示意图;
[0047]图3是本发明实施例提供的基于预读取的资源预置装置示意图。
【具体实施方式】
[0048]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员依次所获得的、而没有经过创造性劳动付出的其他实施例,都属于本发明保护的范围。
[0049]实施例一、基于预读取的资源预置方法。该预置方法的流程如图1所示。
[0050]图1中,S100、获取各站点下的资源的标识,该标识可以唯一表示一个资源,如URL。下面以URL为例对本发明实施例进行说明。
[0051]具体的,本发明实施例可以通过实时或者定时的从网络中收集各终端设备进行网络访问的客户端日志来获取各站点下的资源的URL。该客户端日志记载有用户所使用的各URL信息以及各URL所使用的资源信息。本发明实施例可以先根据从各用户的客户端日志中提取的信息形成站点下的资源的URL列表,然后,再从该列表中获取各站点下的资源的URL (如图2中的101所示)。在本地已经设置有站点下的资源的URL列表的情况下,则可以不进行上述的客户端日志的获取操作,而可以直接从站点下的资源的URL列表中获取各站点下的资源的URL。
[0052]上述URL列表可以具体包括:站点信息、资源信息以及资源对应的URL信息等。另外,上述资源可以具体包括:页面引用的JS (JavaScript,是一种计算机脚本语言)、CSS(Cascading Style Sheet,级联样式表)以及 PHP (Hypertext Preprocessor,英文超文本预处理语言)等的代码文件,上述资源也可以包括:图片以及页面的文件等。本发明实施例不限制资源具体包括的内容。
[0053]S110、根据资源的URL获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理(也可以称为过滤处理),以滤除属于预定类型的资源。
[0054]具体的,本发明实施例需要对所有URL对应的资源进行筛选处理,以获得各站点下的除去属于预定类型的资源之外的资源(可以称为优质资源),如图2中的102所示。上述属于预定类型的资源具体是指不适合提前下发的资源。
[0055]一个具体的例子,如果一资源的原始文件中包含有set cookie (cookie设置)信息,则该资源会受到客户端的cookie信息的影响而发生变化,也就是说,不同客户端的cookie信息会使原始文件中包含有set cookie信息的资源发生变化,这样,如果将此种类型的资源下发给用户,则很可能会出现影响页面正常显示等问题,因此,应将原始文件中包含有cookie设置信息的资源滤除。
[0056]另一个具体的例子,对于资源的内容变化较快的资源,如广告资源等,对于这类资源而言,在资源的内容根据预定时长等因素而发生变化之后,用户的客户端再去访问该资源,这并不会影响到用户对页面的正常访问;因此,本发明实施例可以不向用户提前下发这种类型的资源,从而该种类型的资料需要在过滤过程中被滤除。本发明实施例可以通过对资源的原始文件的大小以及资源的原始文件的缓存时间进行判断,来确定出一个资源是否属于内容变化较快的资源;具体的,本发明实施例可以预先设置变化率阈值,该阈值可以是针对资源的大小以及资源的缓存时间的阈值,这样,本发明实施例可以根据该阈值获取资源的原始文件的相应参数(可以为一个或者多个),并将获取的相应参数与参数对应的阈值进行比较,从而根据比较结果即可确定出该资源是否属于资源的内容变化较快的资源。
[0057]再一个具体的例子,在实际应用中,由于多种原因可能会使资源对应的原始文件成为一个异常的原始文件,而不是一个正常的原始文件,如有的原始文件可能存在文件不完整的问题,有的原始文件中可能会包含有乱码,有的原始文件中会包含有抓取异常的资源的内容等等;如果将这些异常的原始文件下发给用户,则会使用户看到非正常显示的网页,因此,应滤除此类原始文件对应的资源。
[0058]在本实施例中,需要滤除的资源可以不仅限于上述例举的情况,可以根据实际应用确定其他需要滤除的资源的具体类型。另外,本发明实施例可以采用预设的模型进行滤除操作,也可以采用其他方式对资源进行过滤处理。
[0059]S120、根据不同站点对资源的不同引用情况对筛选处理后的资源进行打包处理(如图2中的104所示)。具体的,该步骤可以包括下述S121和S122 (图1中未示出)。
[0060]S121、针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包。
[0061]具体的,本发明实施例在对资源进行公用资源打包处理之前,可以先从筛选处理后的资源中选取出部分资源,然后,再针对选取出的这部分资源进行公用资源打包处理;如果本发明实施例不包括上述从筛选处理后的资源中选取出部分资源的过程,则本发明实施例可以直接针对筛选处理后的资源进行公用资源包的打包处理。
[0062]在本发明实施例包含有从筛选处理后的资源中选取出部分资源的过程的情况下,本发明实施例可以根据各资源的权重值从筛选后的资源中选取出权重值较高的多个资源(如图2中的103所示);且资源的权重值通常可以根据资源使用户受益的程度而设定;也就是说,在向用户下发资源的下发量受限的条件(如用户的带宽以及用户的终端设备的处理能力等)下,本发明实施例需要从筛选后获得的优质资源中筛选出使用户受益最大的资源,并针对这些使用户受益最大的资源进行公用资源包的打包处理。上述用户受益的程度可以通过资源在过去时间段内的用户使用量来衡量,即可以基于资源的使用历史来设置资源的权重值。资源的权重值也可以称为资源的平均收益或者单位收益。
[0063]设置资源的权重值的一个具体的例子为,设定资源的权重值表示为Weight (Resurl),则可以利用下述公式(I)来计算资源的Weight(Resurl);
[0064]Weight (Resurl) =Uv (Resurl) /Size (Resurl)公式(I)
[0065]在上述公式(I)中,Resurl为资源的Url, Size (Resurl)为资源的大小,Uv(Resurl)为一定时间段内(即在过去预定时长的时间窗内)该资源的用户使用量。
[0066]公用资源包是针对公用资源的资源包,S卩如果一个资源可以被多个站点共同引用,则该资源可以称为被多个站点共同引用的公用资源;本发明实施例可以将多个这样的公用资源打包为一个公用资源包;优选的,本发明实施例可以针对所有站点共同引用的所有资源打包处理为一个公用资源包。当然,本发明实施例也可以针对一部分站点共同引用的资源打包处理为一个公用资源包,而针对另一部分站点共同引用的资源打包处理为另一个公用资源包。
[0067]S122、针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包。
[0068]具体的,本发明实施例对本步骤中的站点资源包的打包处理操作和S121中的公用资源包的打包处理操作之间的先后执行顺序并不进行特殊限定,且两者可以并行执行。
[0069]同样的,本发明实施例在对资源进行站点资源打包处理之前,可以先从筛选处理后的资源中选取出部分资源,然后,再针对选取出的这部分资源进行站点资源打包处理;如果本发明实施例不包括上述从筛选处理后的资源中选取出部分资源的过程,则本发明实施例可以直接针对筛选处理后的资源进行站点资源包的打包处理。需要特别说明的是,从筛选处理后的资源中选取出部分资源的步骤并不是在站点资源打包处理之前执行一次,并在公用资源打包处理之前再执行一次,也就是说,本发明实施例可以先从筛选处理后的资源中选取出部分资源,然后,针对该选取出的部分资源进行站点资源打包处理和公用资源打包处理。
[0070]为了使每一个站点资源包中每一个资源都是有可能被用户使用的资源,因此,在进行站点资源包的打包处理过程中,应考虑如何为每一个站点选取其专属引用的资源。本发明实施例在选取站点专属引用的资源时,可以考虑资源的权重值以及资源的大小,即站点资源包中的资源应该是用户使用量较高的资源且站点资源包中所有资源的大小不应超过预定值;一个具体的例子,本发明实施例可以根据下述公式(2)来为一个站点选取需要进行打包的站点专属引用的资源:
[0071]Top (n) {weight Cresurli)}且E size (resurlj) < Size (threshold)公式(2)
[0072]在上述公式(2)中,Top (n) (WeightCresurli))表示针对一个站点的所有专属引用资源而言,权重值最大的前n个资源,Weight (resurlj表示针对一个站点的所有专属引用资源而言,第i个资源的权重值,Size (result)表示针对一个站点的所有专属引用资源而言,第i个资源的大小,Size (threshold)表示客户端设定的下发包的大小。由上述公式
(2)可知,n的取值大小取决于客户端设定的下发包的大小以及前n个资源的大小。
[0073]本发明实施例还可以采用其他方式为一个站点选取需要进行打包的站点专属引用的资源,在此不再逐一例举说明。
[0074]S130、根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的站点资源包,如根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发公用资源包和为用户选取的站点资源包。
[0075]具体的,本发明实施例应针对每个用户均选取需要向其下发的站点资源包,在选取站点资源包时应充分考虑用户的网络访问特征,以便于向用户下发的站点资源包能够尽可能的被用户所使用。
[0076]一个具体的例子,首先,根据用户的历史访问信息获得用户常访问的站点信息
(如图2中的201所示),用户常访问的站点信息可以记为(Site1, site2,......,sitex),
其次,确定用户常访问的各站点的访问权重,用户常访问的站点的访问权重可以具体记为(P(Site1), p (Site2),……,p(siten));用户常访问的站点的访问权重可以根据用户访问该站点的次数或者频率等参数来设定;之后,利用下述公式(3)为用户选取站点资源包(如图2中的201所示):
[0077]Max { E (p (Sitei))}且E size (Sitei)+size (common) < Size (threshold)公式
(3)
[0078]在上述公式(3)中,Sitei为用户访问过的第i个站点,p ( Sitei)为用户访问过的第i个站点的访问权重,size (Sitei)为用户访问过的第i个站点对应的站点资源包的大小,size (common)为通用资源包的大小,Size (threshold)为客户端设定的下发包的大小。
[0079]由于每个用户的网络访问特征通常不尽相同,因此,为不同用户选取的站点资源包通常会不尽相同。另外,由于本发明实施例将不同站点共同引用的资源打包为公用资源包,从而避免了将不同站点共同引用的资源分别放置在不同的站点资源包中多次下发的现象。
[0080]本发明实施例可以针对向用户下发的数据包设定缓存时间,这样,在前一次下发的数据包的缓存时间期满后,可以向用户再次下发当前最新的相应类型的资源包(如图2中的301所示);本发明实施例可以针对每一个站点资源包设置缓存时间,如果向用户下发的各站点资源包的缓存时间`不相同,则可以按照各站点资源包的缓存时间中最短的一个缓存时间进行下次资源包的下发。另外,在下次下发过程中,可以不再重新确定用户的网络访问特征而沿用前一次确定出的用户的网络访问特征。当然,本发明实施例也可以在一定的时间段之后重新确定用户的网络访问特征。
[0081]需要特别说明的是,本发明实施例可以为没有网络访问特征的用户下发通用资源包,而为具有网络访问特征的用户仅下发站点资源包和公用资源包;然而,在实际应用中,也可以在针对具有网络访问特征的用户下发站点资源包和公用资源包的同时,向该用户下发通用资源包,即本发明实施例可以同时向用户下发通用资源包、站点资源包以及公用资源包。在为具有网络访问特征的用户仅下发站点资源包和公用资源包的情况下,上述公式中的size (common)可以设置为O。
[0082]为了使通用资源包中每一个资源都是有可能被用户使用的资源,因此,在进行通用资源包的打包处理过程中,应考虑如何为通用资源包选取资源。本发明实施例在为通用资源包选取资源时,可以考虑资源的权重值以及资源的大小,即通用资源包中的资源应该是用户使用量较高的资源且通用资源包中所有资源的大小不应超过阈值;一个具体的例子,本发明实施例可以根据下述公式(2)来为通用资源包选取需要进行打包的资源:
[0083]Top (n) (weight Cresurli)}且E size Cresurli) < Size (threshold)公式(2)
[0084]在上述公式(2)中,Top (n) weight (resurl^ }表示对所有资源而言,权重值最大的前n个资源,Weight Cresurli)表示第i个资源的权重值,Size Cresurli)表示第i个资源的大小,Size (threshold)表示客户端设定的下发包的大小。由上述公式(2)可知,n的取值大小取决于客户端设定的下发包的大小以及前n个资源的大小。
[0085]实施例二、基于预读取的资源预置方法。
[0086]首先,获取站点对应的URL列表,该URL列表包括的内容的一个具体的实例如下:
[0087]http://www.4399.com/
[0088]——>
[0089]http://s1.1mg4399.com/credit/js/credit—exchange.js?5459
[0090]http://s1.1mg4399.com/home/j s/my.js?6522
[0091]http://www.439`9.com/jss/click—trace, js
[0092]http://www.4399.com/jss/hs—play, js
[0093]http://www.4399.com/jss/hsgame20120529.js
[0094]http://www.4399.com/jss/index20130312.js
[0095]http://www.4399.com/jss/seer—20121224.js
[0096]之后,滤除属于预定类型的资源,即从上述资源中抽取优质资源:
[0097]抽取出的优质资源(用URL来表示)的一个具体实例如下表1所示:
[0098]表1
[0099]
【权利要求】
1.一种基于预读取的资源预置方法,其特征在于,该方法包括: 获取各站点下的资源的标识,所述标识唯一表示一个资源; 根据资源的标识获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源; 根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理; 根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。
2.如权利要求1所述的方法,其特征在于,所述根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理包括: 针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包; 针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包; 且所述根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包包括: 根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。
3.如权利要求1所述的方法,其特征在于,所述获取各站点下的资源的标识的步骤包括: 获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。
4.如权利要求1所述的方法,其特征在于,所述对各资源对应的原始文件进行筛选处理的步骤包括: 滤除原始文件中包含有cookie设置信息的资源;和/或 滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或 滤除原始文件异常的资源。
5.如权利要求1所述的方法,其特征在于,所述方法在打包的步骤之前还包括: 依据资源的权重值从筛选后的资源中选取相应的资源; 且所述筛选处理后的资源为从筛选后的资源中选取的资源。
6.如权利要求5所述的方法,其特征在于,所述资源的权重值是根据资源使用户重视的程度而设定的。
7.如权利要求6所述的方法,其特征在于: 所述资源的权重值根据Weight (resurl) =Uv (resurl) /Size (resurl)计算获得; 其中,Weight (resurl)为资源的权重值,resurl为资源的URL, Uv (resurl)为资源在过去预定时长的时间窗内的用户使用量,Size (resurl)为资源的大小。
8.如权利要求2所述的方法,其特征在于,所述站点资源包的打包操作包括: 针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包; 其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。
9.如权利要求2所述的方法,其特征在于,所述方法还包括: 根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包; 向用户下发所述通用包; 其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。
10.如权利要求2至9中任一权利要求所述的方法,其特征在于,所述根据用户的网络访问特征为各用户分别选取站点资源包的步骤包括:获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{ E (P(P(Sitei))I且E size (Sitei) SiZe (common) < Size (threshold)选取需要向用户下发的站点资源包;其中,Sitei为用户访问过的第i个站点,p (Sitei)为用户访问过的第i个站点的访问权重,size (Sitei)为用户访问过的第i个站点对应的站点资源包的大小,size (common)为通用包的大小,Size (threshold)为客户端设定的下发包的大小。
11.如权利要求1至9中任一权利要求所述的方法,其中,所述下发的步骤还包括: 根据前一次向用户下发的资源包的缓存时间向用户再次下发相应类型的资源包。
12.一种基于预读取的资源预置装置,其特征在于,该装置包括: 获取模块,用于获取各站点下的资源的标识,所述标识唯一表示一个资源; 筛选模块,用于根据资源的标识 获取各资源对应的原始文件,并对各资源对应的原始文件进行筛选处理,以滤除属于预定类型的资源; 打包模块,用于根据不同站点对资源的不同引用情况对所述筛选处理后的资源进行打包处理; 下发模块,用于根据用户的网络访问特征为各用户分别选取资源包,并向各用户分别下发其选取的资源包。
13.如权利要求12所述的装置,其特征在于,所述打包模块具体包括: 公用资源打包子模块,用于针对筛选处理后的资源中的被多个站点共同引用的资源打包为公用资源包; 站点资源打包子模块,用于针对筛选处理后的资源中的各站点专属引用的资源分别打包为站点资源包; 且所述下发模块具体用于: 根据用户的网络访问特征为各用户分别选取站点资源包,并向各用户分别下发所述公用资源包和为其选取的站点资源包。
14.如权利要求12所述的装置,其特征在于,所述获取模块具体用于: 获取客户端进行网络访问的客户端日志,并根据所述客户端日志获取各站点下的各资源的URL。
15.如权利要求12所述的装置,其特征在于,所述筛选模块具体用于: 滤除原始文件中包含有cookie设置信息的资源;和/或 滤除原始文件中的内容变化率超过预定变化率阈值的资源;和/或 滤除原始文件异常的资源。
16.如权利要求12所述的装置,其特征在于,所述装置还包括:选取模块,与筛选模块和打包模块分别连接,用于依据资源的权重值从筛选后的资源中选取相应的资源; 且所述筛选处理后的资源为从筛选后的资源中选取的资源。
17.如权利要求16所述的装置,其特征在于,所述资源的权重值是根据资源使用户重视的程度而设定的。
18.如权利要求17所述的装置,其特征在于: 所述资源的权重值根据Weight (resurl) =Uv (resurl) /Size (resurl)计算获得; 其中,Weight (resurl)为资源的权重值,resurl为资源的URL, Uv (resurl)为资源在过去预定时长的时间窗内的用户使用量,Size (resurl)为资源的大小。
19.如权利要求13所述的装置,其特征在于,所述站点资源打包子模块具体用于: 针对一个站点而言,根据站点专属引用的资源的权重值从该站点专属引用的资源中选取第一预定数量的站点专属引用的资源,并对选取出的第一预定数量的站点专属引用的资源进行打包; 其中,所述第一预定数量根据客户端设定的下发包的大小以及所述选取的站点专属引用的资源的大小确定。
20.如权利要求13所述的装置,其特征在于,所述装置还包括: 通用包打包模块,用于根据资源的权重值从筛选处理后的资源中选取第二预定数量的资源,并将选取的第二预定数量的资源打包为通用包; 且所述下发模块还用于向用户下发所述通用包; 其中,所述第二预定数量根据客户端设定的下发包的大小以及所述选取的资源的大小确定。
21.如权利要求13至10中任一权利要求所述的装置,其特征在于,所述下发模块具体用于:获取用户访问过的站点信息,并针对用户访问过的站点,根据Max{ E (P(Sitei))I且E size (Sitei) +size (common) < Size (thredhold)选取需要向用户下发的站点资源包;其中,Sitei为用户访问过的第i个站点,p (Sitei)为用户访问过的第i个站点的访问权重,size (Sitei)为用户访问过的第i个站点对应的站点资源包的大小,size (common)为通用包的大小,Size (threshold)为客户端设定的下发包的大小。
22.如权利要求13至10中任一权利要求所述的装置,其特征在于,所述下发模块还用于: 根据前一次向用户下发的资源包的缓存时间向用户再次下发相应类型的资源包。
【文档编号】H04L29/08GK103501281SQ201310461750
【公开日】2014年1月8日 申请日期:2013年9月30日 优先权日:2013年9月30日
【发明者】崔华, 郭奇, 汤传喜, 李俊强 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1