网页加载速度的确定方法和装置与流程

文档序号:11063410阅读:271来源:国知局
网页加载速度的确定方法和装置与制造工艺

本申请涉及互联网领域,具体而言,涉及一种网页加载速度的确定方法和装置。



背景技术:

网站中网页的加载速度的评价指标通常是指用户从打开一个网页到该网页完整呈现出来所消耗的时间,这个时间越短,网站给用户带来的体验就越好。通常网站的总的网页数量一般少的有几十万,多的甚至是千万级,如此多的网页,难免会出现一些加载速度慢的网页影响了用户的体验。因此,各网站运营商需要找出这些加载速度慢的网页,以便于确定其加载速度慢的原因,针对性地解决加载速度慢的问题。

如何去找到这样的网页是一个比较难以解决的问题。目前,找出加载速度慢的网页的方式主要是通过人工测试网站各个网页的加载速度。然而,人工测试只能反应测试人员所处的网络环境下对于网页的加载情况,不一定真实反应了网民访问网页时的状况,从而导致对加载速度慢的网页判断不准确。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请实施例提供了一种网页加载速度的确定方法和装置,以至少解决对加载速度慢的网页判断不准确的技术问题。

根据本申请实施例的一个方面,提供了一种网页加载速度的确定方法,包括:对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;以及根据所述停留时间确定访问的网页是否为加载速度慢的网页。

进一步地,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:统计在所述同一会话中所述同一来源在所述同一网页的总停留时间和总访问次数;获取在所述同一会话中所述同一来源最后一次访问所述同一网页的停留时间;利用以下公式计算在所述同一会话中除最后一次访问所述同一网页的平均停留时间: t=(T-T1)/(N-1),其中,T为所述总停留时间,T1为所述最后一次访问所述同一网页的停留时间,N为所述总访问次数;判断所述t是否大于或等于时间阈值;在所述t大于或等于所述时间阈值时,确定所述访问的网页为加载速度慢的网页。

进一步地,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:统计在所述同一会话中所述同一来源访问所述同一网页的停留时间大于等于时间阈值的访问次数;判断停留时间大于等于所述时间阈值的访问次数是否超过次数阈值;在判断出停留时间大于等于所述时间阈值的访问次数超过次数阈值时,确定所述访问的网页为加载速度慢的网页。

进一步地,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:根据所述停留时间确定出疑似加载速度慢的网页;统计对所述疑似加载速度慢的网页加载速度慢的来源数量;判断所述来源数量是否达到预设数量;在判断出所述来源数量达到所述预设数量时,确定所述疑似加载速度慢的网页为加载速度慢的网页。

进一步地,根据所述停留时间确定访问的网页是否为加载速度慢的网页包括:根据所述停留时间确定出疑似加载速度慢的网页;记录所述疑似加载速度慢的网页的统一资源定位符;判断预设时间段内对同一统一资源定位符记录的次数是否超过预设记录次数;在超过所述预设记录次数时,确定超过所述预设记录次数的统一资源定位符对应的网页为加载速度慢的网页。

根据本申请实施例的另一方面,还提供了一种网页加载速度的确定装置,包括:获取单元,用于对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据;提取单元,用于从获取的访问数据中提取在所述同一会话中所述同一来源在所述同一网页的停留时间;以及确定单元,用于根据所述停留时间确定访问的网页是否为加载速度慢的网页。

进一步地,所述确定单元包括:第一统计模块,用于统计在所述同一会话中所述同一来源在所述同一网页的总停留时间和总访问次数;获取模块,用于获取在所述同一会话中所述同一来源最后一次访问所述同一网页的停留时间;计算模块,用于利用以下公式计算在所述同一会话中除最后一次访问所述同一网页的平均停留时间:t=(T-T1)/(N-1),其中,T为所述总停留时间,T1为所述最后一次访问所述同一网页的停留时间,N为所述总访问次数;第一判断模块,用于判断所述t是否大于或等于时间阈值;第一确定模块,用于在所述t大于或等于所述时间阈值时,确定所述访问的网页为加载速度慢的网页。

进一步地,所述确定单元包括:第二统计模块,用于统计在所述同一会话中所述 同一来源访问所述同一网页的停留时间大于等于时间阈值的访问次数;第二判断模块,用于判断停留时间大于等于所述时间阈值的访问次数是否超过次数阈值;第二确定模块,用于在判断出停留时间大于等于所述时间阈值的访问次数超过次数阈值时,确定所述访问的网页为加载速度慢的网页。

进一步地,所述确定单元包括:第三确定模块,用于根据所述停留时间确定出疑似加载速度慢的网页;第三统计模块,用于统计对所述疑似加载速度慢的网页加载速度慢的来源数量;第三判断模块,用于判断所述来源数量是否达到预设数量;第三确定模块,用于在判断出所述来源数量达到所述预设数量时,确定所述疑似加载速度慢的网页为加载速度慢的网页。

进一步地,所述确定单元包括:第四确定模块,用于根据所述停留时间确定出疑似加载速度慢的网页;记录模块,用于记录所述疑似加载速度慢的网页的统一资源定位符;第四判断模块,用于判断预设时间段内对同一统一资源定位符记录的次数是否超过预设记录次数;第五确定模块,用于在超过所述预设记录次数时,确定超过所述预设记录次数的统一资源定位符对应的网页为加载速度慢的网页。

根据本申请实施例,从目标网站的访问数据中获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中获取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页,根据记录有用户的访问行为的访问数据,从用户的实际访问行为来判断加载速度慢的网页,相对于现有技术中在测试网络环境下测试网页的加载情况,真实地反应了网民访问网页时的状况,提高了对加载速度慢的网页判断的准确性,解决了对加载速度慢的网页判断不准确的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的网页加载速度的确定方法的流程图;

图2是根据本申请实施例的网页加载速度的确定装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例 仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例,提供了一种网页加载速度的确定方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本申请实施例的网页加载速度的确定方法的流程图,如图1所示,该方法包括如下步骤:

步骤S102,对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据。

用户在通过终端访问目标网站时,该目标网站通常会记录用户的访问行为,例如,记录访问的网页、访问次数、访问时间、在网页的停留时间、用户的来源(可以是用于表示用户唯一性的标识,例如用户使用的IP地址、终端的mac地址等)等等数据,形成访问数据。本实施例中,目标网站即为测试的网站,该目标网站包含有一定数量的网页页面。

当用户访问某个网页时,如果遇到加载速度过慢的网页会尝试进行刷新,如果对于同一个网页有很多人在访问时都进行了多次(两次以上)刷新,则可以认为该网页的加载速度可能会比较慢,需要进行排查。在本实施例中,一次刷新即为用户对网页的一次请求,用户对网页的一次请求记为一次访问。

通过对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,其中,一个会话指的是同一个来源的用户在网站上一次完整的访问过程。获取上述访问数据具体可以是先从解析结果中对目标网站的访问数据进行遍历,以会话为单位从中找出同一网页被访问的访问次数超过预设访问次 数(可以根需求进行设置)的访问数据,再找出所有在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,以便于从这些数据中获取用户在每次访问时的停留时间。

步骤S104,从获取的访问数据中提取在同一会话中同一来源在同一网页的停留时间。

一次访问的停留时间是指从用户请求加载网页之后,直到用户再次请求加载该网页或者其他网页为止,这之间所经历的时间,无论该网页是否已经加载出来。具体地,可以是获取的访问数据中可以记录有每次访问过程中,用户请求记载网页的时刻以及用户再次请求记载该网页或者请求加载其他网页的时刻,由上述两个时刻计算得到上述停留时间。当然,也可以在用户访问网页时,通过计时器对用户的每次访问进行计时,使得访问数据中直接记录有每次访问的停留时间,这样,在获取到访问数据之后,可以直接从访问数据中提取上述停留时间。获取在一次会话中,用户访问同一网页的每一次访问的停留时间,以便于利用该停留时间确定该网页是否为加载速度慢的网页。

步骤S106,根据停留时间确定访问的网页是否为加载速度慢的网页。

由于用户遇到加载速度过慢的网页会尝试进行刷新,即多次访问相同的网页,则该网页可能是加载速度慢的网页,进一步判断时,根据停留时间确定访问的网页是否为加载速度慢的网页,可以是判断每次访问的停留时间的长短,如果其中多次访问的停留时间较长(大于等于时间阈值),则确定该网页为加载速度慢的网页;也可以是判断多次访问的平均停留时间是否大于等于时间阈值,如果是,则确定该网页为加载速度慢的网页;还可以是判断除最后一次访问的停留时间之外,其他的访问的平均停留时间是否大于等于时间阈值,如果是,则确定该网页为加载速度慢的网页。由于当用户最后一次访问网页的停留时间通常包括用户浏览网页内容的时间,这段时间比较长,将这段停留时间剔除,可以进一步提高判断的准确性。需要说明的是,本申请实施例中,根据停留时间确定访问的网页是否为加载速度慢的网页的具体方式包括但不限于上述方式,这里并没有对本申请有不当限定。

根据本申请实施例,从目标网站的访问数据中获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中获取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页,根据记录有用户的访问行为的访问数据,从用户的实际访问行为来判断加载速度慢的网页,相对于现有技术中在测试网络环境下测试网页的加载情况,真实地反应了网民访问网页时的状况,提高了对加载速度慢的网页判断的准确性,解决了对加载速度慢的网页判断不准确的技术问题。

另外,由于现有技术中人工统计耗时较长,尤其对于大型网站,且人工测试根本无法覆盖目标网站的所有网页。而本申请实施例通过利用目标网站的访问数据来判断加载速度慢的网页,无需人工干预,通过计算机程序等即可对用户所访问的所有网页进行判断,覆盖率高。

优选地,本申请实施例中,可以通过在目标网站添加Tracker(JS脚本),用以收集用户在目标网站的访问数据,统计每个用户在网站中的访问行为,并将该目标网站的所有访问数据都会被发送到指定服务器上,逐条解析服务器收集到的用户访问数据。

优选地,根据停留时间确定访问的网页是否为加载速度慢的网页包括:统计在同一会话中同一来源在同一网页的总停留时间和总访问次数;获取在同一会话中同一来源最后一次访问同一网页的停留时间;利用以下公式计算在同一会话中除最后一次访问同一网页的平均停留时间:t=(T-T1)/(N-1),其中,T为总停留时间,T1为最后一次访问同一网页的停留时间,N为总访问次数;判断t是否大于或等于时间阈值;在t大于或等于时间阈值时,确定访问的网页为加载速度慢的网页。

对于总停留时间的统计,可以是通过加法器将前述中提取到的同一会话中每次访问的停留时间相加,得到总停留时间。对于总访问次数,可以使用计数器对访问数据中同一会话的每次访问进行累加,得到总访问次数。

本实施例中,通过计算对网页的访问(不包括最后一次访问)的平均停留时间,判断该平均停留时间是否大于等于时间阈值,该时间阈值可以是用户访问目标网站的网页的最小访问时间,不同的目标网站,可以设置不同的时间阈值,上述平均停留时间大于等于时间阈值则基本可以认为用户没有浏览网页数据,在此可以认为用户还没等到网页加载出来。由于当用户最后一次访问网页的停留时间通常包括用户浏览网页内容的时间,这段时间比较长,将这段停留时间剔除,可以进一步提高判断的准确性。

例如用户在一次会话中连续访问了一个网页3次,依次访问了10秒,10秒,25秒,其中,用户在该次会话中的最后一次访问花了一定量的时间浏览网页内容,因此,最后一次访问时间较长。假如该目标网站的时间阈值为3s,计算得到用户访问该网页(不包括最后一次访问)的平均停留时间为10s,因此,可以确定该用户访问的网页加载速度慢。如果上述平均访问时间小于时间阈值,可以认为用户对网页的暴力刷新或者是误刷新,不能认为是网页本身加载速度慢。

可选地,根据停留时间确定访问的网页是否为加载速度慢的网页包括:统计在同一会话中同一来源访问同一网页的停留时间大于等于时间阈值的访问次数;判断停留时间大于等于时间阈值的访问次数是否超过次数阈值;在判断出停留时间大于等于时 间阈值的访问次数超过次数阈值时,确定访问的网页为加载速度慢的网页。

本实施例中,可以对一个会话中每次访问的停留时间做一次判断,判断其是否大于等于时间阈值,并记录停留时间大于等于时间阈值的访问次数,再对记录的访问次数进行判断,判断其是否超过次数阈值,也即是确定一个会话中,用户访问网页的停留时间较长的访问次数是否足够多。如果用户在一个会话中,对于同一网页访问的停留时间有一部分时间较长,则可以认为是由于该网页加载速度慢导致用户多次刷新造成的。在判断出停留时间大于等于时间阈值的访问次数超过次数阈值时,确定访问的网页为加载速度慢的网页。

本实施例中,时间阈值与前述实施例的时间阈值可以相同,次数阈值可以根据需求进行设置。

根据本申请实施例,通过设置时间阈值和次数阈值,依次对每次访问的停留时间和停留时间大于等于时间阈值的访问次数进行判断,进一步提高了对加载速度慢的网页的判断的准确性。

优选地,根据停留时间确定访问的网页是否为加载速度慢的网页包括:根据停留时间确定出疑似加载速度慢的网页;统计对疑似加载速度慢的网页加载速度慢的来源数量;判断来源数量是否达到预设数量;在判断出来源数量达到预设数量时,确定疑似加载速度慢的网页为加载速度慢的网页。

由于一个用户加载网页速度慢有可能是由该用户所在的网络环境引起的,而并非网页本身存在问题,存在偶然因素。为剔除该干扰因素,本实施例中,在将根据停留时间确定出的加载速度慢的网页作为疑似加载速度慢的网页,例如,在t大于或等于时间阈值时,确定访问的网页为疑似加载速度慢的网页;或者,在判断出停留时间大于等于时间阈值的访问次数超过次数阈值时,确定访问的网页为疑似加载速度慢的网页,然后再做进一步地判断。具体地,在根据停留时间确定出疑似加载速度慢的网页之后,对该网页进行记录,然后以访问来源为维度,统计该疑似加载速度慢的网页被记录的次数,也即是对疑似加载速度慢的网页加载速度慢的来源数量,如果超过预设数量(可以根据需求进行设置),则表明有一定量的用户加载该网页的速度较慢,因此,可以认为该疑似加载速度慢的网页为加载速度慢的网页。

根据本申请实施例,通过将访问网页的来源作为进一步判断的指标,从而提出偶然因素,进一步提高对加载速度慢的网页的判断的准确性。

优选地,根据停留时间确定访问的网页是否为加载速度慢的网页包括:根据停留时间确定出疑似加载速度慢的网页;记录疑似加载速度慢的网页的统一资源定位符; 判断预设时间段内对同一统一资源定位符记录的次数是否超过预设记录次数;在超过预设记录次数时,确定超过预设记录次数的统一资源定位符对应的网页为加载速度慢的网页。

本实施例中,为了避免由于时间因素影响结果的准确性(例如,某个时间段目标网站的服务器出现故障,该时间段内网页加载出现问题),预先选择一个时间段,即预设时间段,统计在预设时间段内,该同一网页被记录为疑似加载速度慢的网页的次数,判断是否超过预设记录次数,如果超过,则认为该网页为加载速度慢的网页,其中,预设记录次数可以根据需求进行设置。

下面以一种具体示例来对本申请的一种可选的实施方式进行说明,具体包括:

Step1:在目标网站部署Tracker,部署完成之后,用户在该目标网站的所有访问数据都会被发送到指定服务器。

Step2:逐条解析服务器收集到的用户访问数据。

Step3:统计用户访问数据,将同一个用户在一次会话过程中访问网页按照访问的先后顺序进行排序。其中,一个会话指的是一个用户在目标网站上一次完整的访问过程。

Step4:将用户的访问数据进行汇总,找出在同一会话中,连续访问同一个网页超过两次的访问数据,假设某个用户在一次会话过程中连续访问网页P,访问了3次;用户在刷新网页时,服务器端会接收到用户访问同一个网页的数据。

Step5:统计Step4中得到的访问数据,统计在该次会话过程中用户在被连续访问的网页中的总的停留时间T,例如用户在一次会话中连续访问了一个网页3次,依次访问了10秒,10秒,25秒,则T=29秒。

Step6:找出在该次连续访问时,最后一次停留在该网页的时间T1,如上述例子中T1=25秒。

Step7:若(T-T1)/(N-1)>=M则认为该网页可能存在加载较慢的问题,记录该网页的统一资源定位符(Uniform Resoure Locator,简称为URL)和会话信息,否则结束对该会话的分析;M为时间阈值,可以是用户访问网页的最小访问时间,大于等于M则基本可以认为用户没有浏览网页数据,在此可以认为用户还没等到网页加载出来,对于不同类型的网站M的值有所不同,这里的N为连续访问该网页的次数。

Step8:统计一段时间内被记录超过1次,且至少来源与两个用户的网页的URL,可以认为这些URL对应的网页为加载速度慢的网页。

本申请实施例还提供了一种网页加载速度的确定装置,该装置可以用于执行本申请实施例的网页加载速度的确定方法,如图2所示,该装置包括:获取单元10、提取单元20和确定单元30。

获取单元10用于对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据。

用户在通过终端访问目标网站时,该目标网站通常会记录用户的访问行为,例如,记录访问的网页、访问次数、访问时间、在网页的停留时间、用户的来源(可以是用于表示用户唯一性的标识,例如用户使用的IP地址、终端的mac地址等)等等数据,形成访问数据。本实施例中,目标网站即为测试的网站,该目标网站包含有一定数量的网页页面。

当用户访问某个网页时,如果遇到加载速度过慢的网页会尝试进行刷新,如果对于同一个网页有很多人在访问时都进行了多次(两次以上)刷新,则可以认为该网页的加载速度可能会比较慢,需要进行排查。在本实施例中,一次刷新即为用户对网页的一次请求,用户对网页的一次请求记为一次访问。

通过对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,其中,一个会话指的是同一个来源的用户在网站上一次完整的访问过程。获取上述访问数据具体可以是先从解析结果中对目标网站的访问数据进行遍历,以会话为单位从中找出同一网页被访问的访问次数超过预设访问次数(可以根需求进行设置)的访问数据,再找出所有在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,以便于从这些数据中获取用户在每次访问时的停留时间。

提取单元20用于从获取的访问数据中提取在同一会话中同一来源在同一网页的停留时间。

一次访问的停留时间是指从用户请求加载网页之后,直到用户再次请求加载该网页或者其他网页为止,这之间所经历的时间,无论该网页是否已经加载出来。具体地,可以是获取的访问数据中可以记录有每次访问过程中,用户请求记载网页的时刻以及用户再次请求记载该网页或者请求加载其他网页的时刻,由上述两个时刻计算得到上述停留时间。当然,也可以在用户访问网页时,通过计时器对用户的每次访问进行计时,使得访问数据中直接记录有每次访问的停留时间,这样,在获取到访问数据之后,可以直接从访问数据中提取上述停留时间。获取在一次会话中,用户访问同一网页的每一次访问的停留时间,以便于利用该停留时间确定该网页是否为加载速度慢的网页。

确定单元30用于根据停留时间确定访问的网页是否为加载速度慢的网页。

由于用户遇到加载速度过慢的网页会尝试进行刷新,即多次访问相同的网页,则该网页可能是加载速度慢的网页,进一步判断时,根据停留时间确定访问的网页是否为加载速度慢的网页,可以是判断每次访问的停留时间的长短,如果其中多次访问的停留时间较长(大于等于时间阈值),则确定该网页为加载速度慢的网页;也可以是判断多次访问的平均停留时间是否大于等于时间阈值,如果是,则确定该网页为加载速度慢的网页;还可以是判断除最后一次访问的停留时间之外,其他的访问的平均停留时间是否大于等于时间阈值,如果是,则确定该网页为加载速度慢的网页。由于当用户最后一次访问网页的停留时间通常包括用户浏览网页内容的时间,这段时间比较长,将这段停留时间剔除,可以进一步提高判断的准确性。需要说明的是,本申请实施例中,根据停留时间确定访问的网页是否为加载速度慢的网页的具体方式包括但不限于上述方式,这里并没有对本申请有不当限定。

根据本申请实施例,从目标网站的访问数据中获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中获取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页,根据记录有用户的访问行为的访问数据,从用户的实际访问行为来判断加载速度慢的网页,相对于现有技术中在测试网络环境下测试网页的加载情况,真实地反应了网民访问网页时的状况,提高了对加载速度慢的网页判断的准确性,解决了对加载速度慢的网页判断不准确的技术问题。

另外,由于现有技术中人工统计耗时较长,尤其对于大型网站,且人工测试根本无法覆盖目标网站的所有网页。而本申请实施例通过利用目标网站的访问数据来判断加载速度慢的网页,无需人工干预,通过计算机程序等即可对用户所访问的所有网页进行判断,覆盖率高。

优选地,本申请实施例中,可以通过在目标网站添加Tracker(JS脚本),用以收集用户在目标网站的访问数据,统计每个用户在网站中的访问行为,并将该目标网站的所有访问数据都会被发送到指定服务器上,逐条解析服务器收集到的用户访问数据。

优选地,确定单元包括:第一统计模块,用于统计在同一会话中同一来源在同一网页的总停留时间和总访问次数;获取模块,用于获取在同一会话中同一来源最后一次访问同一网页的停留时间;计算模块,用于利用以下公式计算在同一会话中除最后一次访问同一网页的平均停留时间:t=(T-T1)/(N-1),其中,T为总停留时间,T1为最后一次访问同一网页的停留时间,N为总访问次数;第一判断模块,用于判断t是否大于或等于时间阈值;第一确定模块,用于在t大于或等于时间阈值时,确定访问 的网页为加载速度慢的网页。

对于总停留时间的统计,可以是通过加法器将前述中提取到的同一会话中每次访问的停留时间相加,得到总停留时间。对于总访问次数,可以使用计数器对访问数据中同一会话的每次访问进行累加,得到总访问次数。

本实施例中,通过计算对网页的访问(不包括最后一次访问)的平均停留时间,判断该平均停留时间是否大于等于时间阈值,该时间阈值可以是用户访问目标网站的网页的最小访问时间,不同的目标网站,可以设置不同的时间阈值,上述平均停留时间大于等于时间阈值则基本可以认为用户没有浏览网页数据,在此可以认为用户还没等到网页加载出来。由于当用户最后一次访问网页的停留时间通常包括用户浏览网页内容的时间,这段时间比较长,将这段停留时间剔除,可以进一步提高判断的准确性。

例如用户在一次会话中连续访问了一个网页3次,依次访问了10秒,10秒,25秒,其中,用户在该次会话中的最后一次访问花了一定量的时间浏览网页内容,因此,最后一次访问时间较长。假如该目标网站的时间阈值为3s,计算得到用户访问该网页(不包括最后一次访问)的平均停留时间为10s,因此,可以确定该用户访问的网页加载速度慢。如果上述平均访问时间小于时间阈值,可以认为用户对网页的暴力刷新或者是误刷新,不能认为是网页本身加载速度慢。

可选地,确定单元包括:第二统计模块,用于统计在同一会话中同一来源访问同一网页的停留时间大于等于时间阈值的访问次数;第二判断模块,用于判断停留时间大于等于时间阈值的访问次数是否超过次数阈值;第二确定模块,用于在判断出停留时间大于等于时间阈值的访问次数超过次数阈值时,确定访问的网页为加载速度慢的网页。

本实施例中,可以对一个会话中每次访问的停留时间做一次判断,判断其是否大于等于时间阈值,并记录停留时间大于等于时间阈值的访问次数,再对记录的访问次数进行判断,判断其是否超过次数阈值,也即是确定一个会话中,用户访问网页的停留时间较长的访问次数是否足够多。如果用户在一个会话中,对于同一网页访问的停留时间有一部分时间较长,则可以认为是由于该网页加载速度慢导致用户多次刷新造成的。在判断出停留时间大于等于时间阈值的访问次数超过次数阈值时,确定访问的网页为加载速度慢的网页。

本实施例中,时间阈值与前述实施例的时间阈值可以相同,次数阈值可以根据需求进行设置。

根据本申请实施例,通过设置时间阈值和次数阈值,依次对每次访问的停留时间 和停留时间大于等于时间阈值的访问次数进行判断,进一步提高了对加载速度慢的网页的判断的准确性。

优选地,确定单元包括:第三确定模块,用于根据停留时间确定出疑似加载速度慢的网页;第三统计模块,用于统计对疑似加载速度慢的网页加载速度慢的来源数量;第三判断模块,用于判断来源数量是否达到预设数量;第三确定模块,用于在判断出来源数量达到预设数量时,确定疑似加载速度慢的网页为加载速度慢的网页。

由于一个用户加载网页速度慢有可能是由该用户所在的网络环境引起的,而并非网页本身存在问题,存在偶然因素。为剔除该干扰因素,本实施例中,在将根据停留时间确定出的加载速度慢的网页作为疑似加载速度慢的网页,例如,在t大于或等于时间阈值时,确定访问的网页为疑似加载速度慢的网页;或者,在判断出停留时间大于等于时间阈值的访问次数超过次数阈值时,确定访问的网页为疑似加载速度慢的网页,然后再做进一步地判断。具体地,在根据停留时间确定出疑似加载速度慢的网页之后,对该网页进行记录,然后以访问来源为维度,统计该疑似加载速度慢的网页被记录的次数,也即是对疑似加载速度慢的网页加载速度慢的来源数量,如果超过预设数量(可以根据需求进行设置),则表明有一定量的用户加载该网页的速度较慢,因此,可以认为该疑似加载速度慢的网页为加载速度慢的网页。

根据本申请实施例,通过将访问网页的来源作为进一步判断的指标,从而提出偶然因素,进一步提高对加载速度慢的网页的判断的准确性。

优选地,确定单元包括:第四确定模块,用于根据停留时间确定出疑似加载速度慢的网页;记录模块,用于记录疑似加载速度慢的网页的统一资源定位符;第四判断模块,用于判断预设时间段内对同一统一资源定位符记录的次数是否超过预设记录次数;第五确定模块,用于在超过预设记录次数时,确定超过预设记录次数的统一资源定位符对应的网页为加载速度慢的网页。

本实施例中,为了避免由于时间因素影响结果的准确性(例如,某个时间段目标网站的服务器出现故障,该时间段内网页加载出现问题),预先选择一个时间段,即预设时间段,统计在预设时间段内,该同一网页被记录为疑似加载速度慢的网页的次数,判断是否超过预设记录次数,如果超过,则认为该网页为加载速度慢的网页,其中,预设记录次数可以根据需求进行设置。

所述网页加载速度的确定装置包括处理器和存储器,上述获取单元、提取单元、确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。上述预设访问次数、时间阈值、次数阈值等等都可以存储在存储器中。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解析文本内容。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中提取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所 述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1