一种获取网页首屏时间的方法及装置与流程

文档序号:11147769阅读:550来源:国知局
一种获取网页首屏时间的方法及装置与制造工艺

本发明涉及互联网技术领域,尤其涉及一种获取网页首屏时间的方法及装置。



背景技术:

网页首屏时间是用来评价网页业务质量的关键指标,网页首屏时间是指用户发起网页浏览操作到用户设备的屏幕完整呈现网页内容的时间。

目前获取网页首屏时间是采用探针拨测的方式,这需要在用户侧部署专门的软件或硬件设备作为探针,并挂在用户家庭网关或者安装在用户的电脑中。如果要采集大量的用户数据,则需要部署大量探针,那么则需要巨大的投资;此外,因为在拨测的时候是模拟用户的网页浏览操作,需要占用用户的流量,会影响用户的正常上网,而且发生的费用由用户来承担,这将导致用户不愿意配合进行探针部署,因此,大量获取用户的网页首屏时间在实际操作过程中会遇到很大的困难。



技术实现要素:

本发明实施例提供一种获取网页首屏时间的方法及装置,能够解决用户不愿意配合安装探针则难以获取网页首屏时间的问题。

为达到上述目的,本发明实施例采用如下技术方案:

第一方面,本发明提供一种获取网页首屏时间的方法,所述网页包括网页文件和页面元素文件,所述方法包括:

根据终端接入标识和网页标识获取深度报文检测DPI系统中对应的流量记录,所述流量记录包括所述终端接入标识对应的终端访问所述网页标识对应的网页时产生的数据包和每一个所述数据包对应的发送时间或者接收时间,所述数据包包括请求数据包和响应数据包;

根据所述流量记录确定所述网页标识对应的网页文件的请求时间和网页文件的返回时间,将所述网页文件的返回时间和所述网页文件的请求时间的差值确定为网页文件的加载时间;

获取所述网页标识对应的至少一个首屏页面元素,每个所述首屏页面元素对应一个首屏页面元素文件;

根据所述流量记录确定所述首屏页面元素文件的请求时间和所述首屏页面元素文件的返回时间,将所述首屏页面元素文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为所述首屏页面元素文件的加载时间;

将所述网页文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为网页解析时间;

根据所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间确定所述网页的网页首屏时间。

第二方面,本发明提供一种获取网页首屏时间的装置,所述网页包括网页文件和页面元素文件,所述装置包括:

获取模块,用于根据终端接入标识和网页标识获取深度报文检测DPI系统中对应的流量记录,所述流量记录包括所述终端接入标识对应的终端访问所述网页标识对应的网页时产生的数据包和每一个所述数据包对应的发送时间或者接收时间,所述数据包包括请求数据包和响应数据包;

确定模块,用于根据所述获取模块获取的所述流量记录确定所述网页标识对应的网页文件的请求时间和网页文件的返回时间,将所述网页文件的返回时间和所述网页文件的请求时间的差值确定为网页文件的加载时间;

所述获取模块,还用于获取所述网页标识对应的至少一个首屏页面元素,每个所述首屏页面元素对应一个首屏页面元素文件;

所述确定模块,还用于根据所述获取模块获取的所述流量记录确定所述首屏页面元素文件的请求时间和所述首屏页面元素文件的返回时间,将所述首屏页面元素文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为所述首屏页面元素文件的加载时间;

所述确定模块,还用于将所述网页文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为网页解析时间;

所述确定模块,还用于根据所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间确定所述网页的网页首屏时间。

本发明实施例提供的一种获取网页首屏时间的方法及装置,通过根据在网络侧提取DPI系统中的流量记录,分别获取网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间,再根据网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间确定网页首屏时间。相比较于现有技术中的在用户侧部署专门的软件或硬件设备作为探针,并挂在用户家庭网关或者安装在用户的电脑中,本发明不需要再在用户侧部署探针,不需要占用用户的流量,可以直接根据网络侧DPI系统中的流量记录进行处理,方便地得到网页首屏时间,进而可以根据网页首屏时间评价互联网业务的质量,为运营商和互联网公司提供提升用户感知的依据。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种获取网页首屏时间的方法流程图;

图2为本发明实施例提供的另一种获取网页首屏时间的方法流程图;

图3为本发明实施例提供的一种获取网页首屏时间的装置结构图;

图4为本发明实施例提供的一种获取网页首屏时间的终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

随着数据业务的发展和精细化运营,运营商通常要对流经网络的数据报文进行DPI(Deep Packet Inspection,深度报文检测)。DPI技术是一种基于应用层的流量检测和控制技术,当IP(Internet Protocol,网络之间互连的协议)数据包、TCP(Transmission Control Protocol,传输控制协议)或UDP(User Datagram Protocol,用户数据报协议)数据流通过基于DPI技术的带宽管理系统时,该系统通过深入读取IP包载荷的内容来对OSI(Open System Interconnection,开放式系统互联)七层协议中的应用层信息进行重组,从而得到整个应用程序的内容,然后按照系统定义的管理策略对流量进行整形操作,从而形成符合管理策略的一系列流量记录。而本发明实施例正是基于DPI系统得到的流量记录进行进一步的分析和处理。

本发明实施例提供一种获取网页首屏时间的方法,如图1所示,包括:

101、根据终端接入标识和网页标识获取DPI系统中对应的流量记录。

其中,所述流量记录包括所述终端接入标识对应的终端访问所述网页标识对应的网页时产生的数据包和每一个所述数据包对应的发送时间或者接收时间;终端接入标识可以是终端IP地址,网页标识可以是网页的地址。

作为一种具体实施例,对DPI系统中的流量记录进行监测,识别每条流量记录的源IP地址、源端口号、目的IP地址、目的端口号等信息,将源IP地址和目的IP地址与AAA(Authentication、Authorization、Accounting,验证、授权和记账)服务器中的终端接入标识进行关联,从而识别出终端接入标识对应的流量记录。再从终端接入标识对应的流量记录中获取与网页标识对应的数据流量记录。

此外,为了能快速查找到流量记录中所需要的数据包,可对数据包预先进行分类,如果数据包中终端接入标识是源IP,表明这些数据包是由终端发出的,则数据包为上行数据包;如果数据包中终端接入标识是目的IP地址,表明这些数据包是发往终端的,则数据包为下行数据包。

然后过滤出HTTP(HyperText Transfer Protocol,超文本传输协议)的数据包,过滤方法如下:

1)选择TCP数据包,因为HTTP数据包是通过TCP协议承载的。

2)对TCP报文的负荷进行分析,使用ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)编码对负荷解析成文本,使用回车符和换行符(‘\r\n’)对文本进行切分成行。对每一行文本,使用空格符将文本切分成字段。

3)对于上行数据包,第一个字段匹配“GET”、或“POST”、或“DELETE”、或“HEAD”、或“OPTIONS”、或“PUT”、或“TRACE”,第三个字段匹配“HTTP/1.1”或“HTTP/1.0”,如果两个字段都匹配成功,则确定该数据包为HTTP的请求数据包。

4)对于下行数据包,第一个字段匹配“HTTP/1.1”或“HTTP/1.0”,第二个字段匹配三位数字,例如“200”,如果两个字段都匹配成功,则确定该数据包为HTTP的响应数据包。

102、根据所述流量记录确定所述网页标识对应的网页文件请求时间和网页文件返回时间,将所述网页返回时间和所述网页请求时间的差值确定为网页加载时间。

一般情况下,一个网页包括一个网页文件和若干个页面元素文件。其中,网页文件中通常还包括需要二次访问的页面元素的超链接地址,该超链接地址对应于页面元素文件。要完整呈现首屏内容包括加载该网页文件以及加载该网页文件中包括的首屏页面元素的内容,而本步骤的网页文件的加载时间仅仅是指从请求该网页文件到该网页文件加载结束的时间,不包含加载首屏页面元素文件的时间。

作为一种具体实施例,在步骤101中获取到的流量记录中,查找用于请求加载该网页文件的请求数据包,该请求数据包的发送时间即可确定为网页文件的请求时间。再查找与该请求数据包对应的全部响应报文,这些响应报文全部接收完毕的时间为网页文件加载完成时间,该时间可确定为网页文件的返回时间。

具体地,确定网页请求时间的方法包括:对获取的包含该网页标识的请求数据包的第一行以下,连续两个回车符和换行符(‘\r\n\r\n’)以上的文本进行分析,步骤如下:

1)使用回车符和换行符(‘\r\n’)对请求数据包的文本进行切分成行,使用空格对每行数据切分成字段。

2)查找第一行以“GET”为第一个字段的行,将第二个字段的内容标记为“part1”。然后,在该数据包中查找以“Host:”为第一字段的行,将该行的第二字段的内容标记为“part2”,“part2”和“part1”的内容连接起来即为请求的网页地址(即网页标识),而该请求数据包对应的发送时间即为网页请求时间。

确定网页请返回时间的方法具体包括:在与上述请求数据包同一个TCP会话中,获取该请求数据包对应的响应数据包,该响应数据包的数量至少为一个。对响应数据包的第一行以下,连续两个回车符和换行符(‘\r\n\r\n’)以上的文本进行分析,步骤如下:

1)使用回车符和换行符(‘\r\n’)对响应数据包的文本进行切分成行,使用空格对每行数据切分成字段。

2)对第一个响应数据包进行分析(根据TCP的序列号字段来判断),查找以“Content-Length:”开始的行,该字段后面的数值即为网页的大小。

3)统计TCP会话中该请求数据包对应的响应数据包负荷的大小,当等于请求的网页的大小时,则表示该网页加载完毕,最后一个响应数据包对应的接收时间即为网页返回时间。

此外,如果第一个响应数据包没有以“Content-Length:”开始的行,则可查找响应数据包中包含“Connection:close”的行,该行信息表示该网页传输完毕。因此,该包含“Connection:close”的响应数据包对应的接收时间即为网页返回时间。

如果既没有以“Content-Length:”开始的行,又没有以“Connection:close”的行,则在该TCP会话中查找响应数据包的头部,根据数据包的头部的URL(Uniform Resoure Locator,统一资源定位符)的信息判断是否为网页响应的文件,当该头部信息显示为不是该网页响应文件时,该数据包的上一个响应数据包为请求网页的最后一个响应数据包。最后一个响应数据包对应的接收时间即为网页文件的返回时间。

最后,网页返回时间减去网页请求时间即为网页加载时间。

103、获取所述网页标识对应的至少一个首屏页面元素。

具体地,网页中通常还会包含需要二次访问的页面元素,如图片元素、外联脚本元素、外联层叠样式表元素、框架元素等,而这些需要二次访问的页面元素分别对应页面元素服务器中的相应的页面元素文件,而首屏页面元素是指在终端的第一屏页面中显示的,需要二次访问的页面元素。

作为一种具体实施例,由于需要二次访问的页面元素具有特定的格式,所以根据特定格式从请求数据包中识别出需二次访问的页面元素。例如:图片类型的页面元素对应的html(HyperText Markup Language,超级文本标记语言)格式为<img src=”image.jpg”/>,其中src表示所包含的图片文件;外联脚本元素的格式为<script scr=”behavior.js”></script>,其中src表示脚本文件;外联层叠样式表元素的格式为<link rel=”stylesheet”,href=”style.css”/>,其中href表示层叠样式表文件;框架元素的格式为<iframe src=”frame.htm”></iframe>,其中src表示框架内的页面文件。

由于终端屏幕的尺寸大小以及用户对页面缩放比例的设置不同,同一网页在终端的第一屏上显示的页面大小也会不同,显示出的首屏页面元素的个数也会不同,当对获取网页首屏时间要求精度较高时,需要针对具体情况精确获取首屏页面元素。

用户也可以设置一个终端的常用屏幕尺寸,且页面缩放比例为常用值的页面中所能显示的首屏页面元素作为参考,当对获取网页首屏时间要求精度不高时,可直接采用参考中首屏页面元素。

最后,从网页文件中获取首屏页面元素的标识,用于查找首屏页面元素对应的首屏页面元素文件。

104、根据所述流量记录确定所述首屏页面元素文件的请求时间和所述首屏页面元素文件的返回时间,将所述首屏页面元素的文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为所述首屏页面元素文件的加载时间。

其中,首屏页面元素文件的加载时间是指从开始请求第一个加载的首屏页面元素文件到最后一个加载的首屏页面元素文件结束的时间。

在步骤101中获取到的流量记录中,查找用于请求加载第一个首屏页面元素的标识对应的请求数据包,该请求数据包的发送时间即可确定为首屏页面元素文件的请求时间。

查找用于加载最后一个首屏页面元素的请求数据包,再查找与该请求数据包对应的全部响应报文,这些响应报文全部接受完毕的时间可确定为首屏页面元素的返回时间。

具体的请求时间和返回时间的确定方法可参考步骤102,在此不重复赘述。

最后,首屏页面元素文件的返回时间减去首屏页面元素文件的请求时间即为首屏页面元素文件的加载时间。

105、将所述网页文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为网页解析时间。

具体地,网页加载的过程包括:终端请求加载网页文件,网页服务器响应请求,发送网页文件。终端接收网页文件,接收完毕后,终端开始对网页文件的内容进行解析,得到需要二次访问的首屏页面元素文件,然后再请求加载首屏页面元素文件。其中,网页解析时间是指从网页返回完毕到开始请求首屏页面元素文件之间的时间即为网页解析时间。

106、根据所述网页加载时间、所述首屏页面元素的加载时间和所述网页解析时间确定所述网页首屏时间。

作为一种具体实施例,将网页加载时间、首屏页面元素的加载时间和网页解析时间相加得到同一终端访问同一网页的网页首屏时间。

本发明实施例提供的一种获取网页首屏时间的方法,通过根据在网络侧提取DPI系统中的流量记录,分别获取网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间,再根据网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间确定网页首屏时间。相比较于现有技术中的在用户侧部署专门的软件或硬件设备作为探针,并挂在用户家庭网关或者安装在用户的电脑中,本发明不需要再在用户侧部署探针,不需要占用用户的流量,可以直接根据网络侧DPI系统中的流量记录进行处理,方便地得到网页首屏时间,进而可以根据网页首屏时间评价互联网业务的质量,为运营商和互联网公司提供提升用户感知的依据。

进一步地,作为对图1所示方法的细化和扩展,本发明实施例还提供了一种获取网页首屏时间的方法,如图2所示,在步骤106之后,该方法还包括:

107、当步骤106获取的网页首屏时间大于预设阈值时,确定所述终端访问所述网页的网页文件的平均加载时间、首屏页面元素文件的平均加载时间和网页的平均解析时间。

其中,预设阈值可以确定为同一终端多次访问同一网址时网页首屏时间的平均值。预设阈值的选择也可根据用户对网页首屏时间的要求进行确定,具体确定标准在此不做限定。

作为一种具体的实施例,终端多次访问网页时,先确定每一次的网页文件的加载时间,然后对这些网页文件的加载时间求平均值,该平均值确定为网页文件的平均加载时间。

类似方法确定首屏页面元素文件的平均加载时间和网页的平均解析时间,在此不重复赘述。

108、比较所述网页文件的加载时间与所述平均网页文件的加载时间、所述首屏页面元素文件的加载时间与所述首屏页面元素文件的平均加载时间以及所述网页解析时间和所述网页的平均解析时间。

作为一种具体实施例,计算步骤102中确定的网页文件的加载时间和平均网页文件的加载时间的差值,计算步骤104中确定的首屏页面元素文件的加载时间和首屏页面元素文件的平均加载时间的差值,计算步骤105中确定的网页解析时间和网页的平均解析时间的差值,并比较三个差值的相对大小。

109、根据比较结果确定影响所述网页首屏时间的因素。

作为一种具体实施例,当步骤106中确定的网页首屏时间大于预设阈值时,表明网页首屏时间过长,需要分析和确定影响网页首屏时间的因素。步骤108中确定的三个参数的差值(网页文件的加载时间与网页文件的平均加载时间的差值,首屏页面元素文件的加载时间和首屏页面元素文件的平均加载时间的差值,网页解析时间和网页的平均解析时间的差值)越大,表明对网页首屏时间的影响也越大。根据差值的相对大小,可以定位网页首屏时间的瓶颈因素。

本发明实施例提供的一种获取网页首屏时间的方法,通过根据在网络侧提取DPI系统中的流量记录,分别获取网页文件的平均加载时间、首屏页面元素文件的平均加载时间和网页的平均解析时间,进而确定网页首屏时间的瓶颈因素。相比较于现有技术中只是获取单一终端单次访问网页的一个网页首屏时间相比,本发明直接根据网络侧DPI系统中的流量记录,计算出实际计算得到的三个参数与这三个平均值的差值情况,定位影响网页首屏时间的因素以及影响程度,为运营商和互联网公司提供提升用户感知的依据。

此外,为了更精确的获取影响网页首屏时间的瓶颈因素,以及为改进网页首屏时间提供依据,本发明实施例还提供了另一种获取三个参数的平均值的方法,如下:

另一种获取平均网页文件的加载时间的具体方法,如下:

需要说明的是,同一终端在请求访问同一网页时,该网页的文件可能保存在多个不同位置的网址服务器上,由于受终端的地理位置和传输网络等因素的影响,每一次响应终端的请求的网址服务器也有可能不同,而不同的网址服务器响应时,对应的网页加载时间不同,故需要针对不同的网址服务器计算相应的网页加载时间。

作为一种具体实施例,在步骤101获取的请求数据包中,首先,查找以“Host:”为第一字段的行,该行的第二字段即为网页服务器的IP地址或者为网页对应的域名,若为网页对应的域名则可通过该请求数据包的目的IP地址确定为网页服务器的IP地址。

然后,针对同一终端访问同一网址时,同一个网页服务器响应时,确定每一次的网页请求时间和网页返回时间,进而确定每一次的网页加载时间。再对这些网页加载时间求平均数,即反映该网页服务器响应时对应的平均加载时间。

最后,依照此方法分别获取不同网页服务器响应时对应的平均加载时间,并建立一个网页服务器的IP地址和其对应的平均网页加载时间的列表,通过该列表可以反映不同网页服务器响应同一终端访问同一网页的平均加载时间,其数值的大小可以反映不同网址服务器对网页首屏时间的不同影响情况,既可根据精确的确定影响网页首屏时间的瓶颈因素,精确到具体响应的网址服务器,又可以为改进瓶颈因素提供改进方向和依据。

另一种获取首屏页面元素文件的平均加载时间的具体方法,如下:

需要说明的是,同一终端在请求访问同一网页的同一首屏页面元素时,该首屏页面元素的文件可能保存在不同位置的页面元素服务器上,由于受终端的地理位置和传输网络等因素的影响,每一次响应终端的请求的页面元素服务器也有可能不同,而不同的页面元素服务器响应时,对应的页面元素对应的加载时间不同,故需要针对不同的页面元素服务器计算相应的页面元素的加载时间。

作为一种具体实施例,在步骤101获取的请求数据包中,首先,查找以“Host:”为第一字段的行,该行的第二字段即为页面元素服务器的IP地址或者为页面元素对应的域名,若为页面元素对应的域名则可通过该请求数据包的目的IP地址确定为页面元素服务器的IP地址。

然后,针对同一终端访问同一网址时,同一个页面元素服务器响应时,确定每一次页面元素的请求时间和返回时间,进而确定每一次的页面元素的加载时间。再对这些页面元素服务器的加载时间求平均数,即反映该首屏页面元素服务器响应时对应的首屏页面元素的平均加载时间。

最后,依照此方法分别获取不同首屏页面元素服务器响应时的平均加载时间,并建立一个首屏页面元素服务器的IP地址和其对应的首屏页面元素文件的平均加载时间的列表,通过该列表可以反映不同首屏页面元素服务器响应同一终端访问同一首屏页面元素的平均加载时间,其数值的大小可以反映不同首屏页面元素服务器对网页首屏时间的影响情况,既可根据精确的确定影响网页首屏时间的瓶颈因素,精确到具体响应的首屏页面元素服务器,又可以为改进瓶颈因素提供改进方向和依据。

另一种获取网页的平均解析时间的具体方法,如下:

网页的平均解析时间需要说明的是,同一终端在请求访问同一网页时,但由于终端的User-Agent字段对应的用户代理信息的不同,用户代理信息包括硬件类型、硬件配置和软件版本等,网页的解析时间也会有所不同。

作为一种具体实施例,首先,在步骤101获取的请求数据包中,查找以“User-Agent:”为第一字段的行,第二字段的内容的信息为User-Agent信息。

然后,针对同一终端访问同一网址时,终端对应的User-Agent信息相同时,确定每一次访问的网页解析时间,再对网页解析时间求平均数,即反映该User-Agent信息对应的平均解析时间。

网页的平均解析时间网页的平均解析时间最后,依照此方法分别获取不同User-Agent对应网页的平均解析时间,并建立一个User-Agent信息对应的网页的平均解析时间的列表,通过该列表可以反映不同User-Agent解析同一网址文件的平均时间,其数值的大小可以反映不同User-Agent字段对网页首屏时间的影响情况,既可根据精确的确定影响网页首屏时间的瓶颈因素,精确到具体终端的User-Agent信息,又可以为改进瓶颈因素提供改进方向和依据。

此外,基于这种获取三个参数的平均值的方法上,获取网页首屏时间的平均值也可采取如下方法:

获取上述多个平均网页加载时间、多个平均首屏页面元素的加载时间和多个网页的平均解析时间中的最小值,根据公式计算得到最优网页首屏时间。网页的平均解析时间获取其中的最大值,根据公式计算得到最差网页首屏时间。

可以根据步骤106中确定的网页首屏时间在最优网页首屏时间和最差网页首屏时间之间的位置情况来评价网页质量的情况,也可根据最优网页首屏时间和最差网页首屏时间的平均值来确定平均网页首屏时间,该平均网页首屏时间可作为预设阈值,需要说明是这里仅仅给出了预设阈值的一种示例,具体预设阈值的设置在此不做限定。

本发明实施例还提供一种获取网页首屏时间的装置30,如图3所示,所述网页包括网页文件和页面元素文件,所述装置包括:

获取模块31,用于根据终端接入标识和网页标识获取深度报文检测DPI系统中对应的流量记录,所述流量记录包括所述终端接入标识对应的终端访问所述网页标识对应的网页时产生的数据包和每一个所述数据包对应的发送时间或者接收时间,所述数据包包括请求数据包和响应数据包。

确定模块32,用于根据所述获取模块31获取的所述流量记录确定所述网页标识对应的网页文件的请求时间和网页文件的返回时间,将所述网页文件的返回时间和所述网页文件的请求时间的差值确定为网页文件的加载时间。

所述获取模块31,还用于获取所述网页标识对应的至少一个首屏页面元素,每个所述首屏页面元素对应一个首屏页面元素文件。

所述确定模块32,还用于根据所述获取模块31获取的所述流量记录确定所述首屏页面元素文件的请求时间和所述首屏页面元素文件的返回时间,将所述首屏页面元素文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为所述首屏页面元素文件的加载时间。

所述确定模块32,还用于将所述网页文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为网页解析时间。

所述确定模块32,还用于根据所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间确定所述网页的网页首屏时间。

进一步地,所述确定模块32,还用于将包含所述网页标识且用于请求加载所述网页文件的请求数据包对应的发送时间确定为所述网页文件的请求时间;查找包含所述网页标识且用于请求加载所述网页文件的所述请求数据包对应的至少一个所述响应数据包;将所述至少一个所述响应数据包中最后接收的所述响应数据包对应的接收时间确定为网页文件的返回时间。

所述确定模块32,还用于确定用于请求加载第一个所述首屏页面元素文件的所述请求数据包对应的发送时间为所述首屏页面元素文件的请求时间;查找用于请求加载最后一个所述首屏页面元素文件的所述请求数据包对应的至少一个所述响应数据包;将所述至少一个所述响应数据包中最后接收的所述响应数据包对应的接收时间确定为首屏页面元素文件的返回时间。

所述确定模块32,还用于将所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间的和值确定为所述网页的网页首屏时间。

所述确定模块32,还用于当所述网页首屏时间大于预设阈值时,确定所述终端访问所述网页的网页文件的平均加载时间、首屏页面元素文件的平均加载时间和网页的平均解析时间;比较所述网页文件的加载时间与所述网页文件的平均加载时间、所述首屏页面元素文件的加载时间与所述首屏页面元素文件的平均加载时间以及所述网页解析时间和所述网页的平均解析时间;根据比较结果确定影响所述网页首屏时间的因素。

本发明实施例提供的一种获取网页首屏时间的装置,通过根据在网络侧提取DPI系统中的流量记录,分别获取网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间,再根据网页文件的加载时间、首屏页面元素文件的加载时间和网页解析时间确定网页首屏时间。相比较于现有技术中的在用户侧部署专门的软件或硬件设备作为探针,并挂在用户家庭网关或者安装在用户的电脑中,本发明不需要再在用户侧部署探针,不需要占用用户的流量,可以直接根据网络侧DPI系统中的流量记录进行处理,方便地得到网页首屏时间,进而可以根据网页首屏时间评价互联网业务的质量,为运营商和互联网公司提供提升用户感知的依据。

如图4所示,本发明实施例提供一种获取网页首屏时间的终端,包括:处理器401、存储器402、收发器403以及总线404,所述处理器401、存储器402和收发器403通过所述总线404互相通信。其中,所述存储器402用于存储多个指令以实现本发明提供的拨号方法,所述处理器401执行所述多个指令以实现根据终端接入标识和网页标识获取深度报文检测DPI系统中对应的流量记录,所述流量记录包括所述终端接入标识对应的终端访问所述网页标识对应的网页时产生的数据包和每一个所述数据包对应的发送时间或者接收时间,所述数据包包括请求数据包和响应数据包;根据所述流量记录确定所述网页标识对应的网页文件的请求时间和网页文件的返回时间,将所述网页文件的返回时间和所述网页文件的请求时间的差值确定为网页文件的加载时间;获取所述网页标识对应的至少一个首屏页面元素,每个所述首屏页面元素对应一个首屏页面元素文件;根据所述流量记录确定所述首屏页面元素文件的请求时间和所述首屏页面元素文件的返回时间,将所述首屏页面元素文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为所述首屏页面元素文件的加载时间;将所述网页文件的返回时间和所述首屏页面元素文件的请求时间的差值确定为网页解析时间;根据所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间确定所述网页的网页首屏时间。

进一步的,所述处理器401还用于将包含所述网页标识且用于请求加载所述网页文件的请求数据包对应的发送时间确定为所述网页文件的请求时间;查找包含所述网页标识且用于请求加载所述网页文件的所述请求数据包对应的至少一个所述响应数据包;将所述至少一个所述响应数据包中最后接收的所述响应数据包对应的接收时间确定为网页文件的返回时间。

进一步的,所述处理器401还用于确定用于请求加载第一个所述首屏页面元素文件的所述请求数据包对应的发送时间为所述首屏页面元素文件的请求时间;查找用于请求加载最后一个所述首屏页面元素文件的所述请求数据包对应的至少一个所述响应数据包;将所述至少一个所述响应数据包中最后接收的所述响应数据包对应的接收时间确定为首屏页面元素文件的返回时间。

进一步的,所述处理器401还用于将所述网页文件的加载时间、所述首屏页面元素文件的加载时间和所述网页解析时间的和值确定为所述网页的网页首屏时间。

进一步的,所述处理器401还用于当所述网页首屏时间大于预设阈值时,确定所述终端访问所述网页的网页文件的平均加载时间、首屏页面元素文件的平均加载时间和网页的平均解析时间;比较所述网页文件的加载时间与所述网页文件的平均加载时间、所述首屏页面元素文件的加载时间与所述首屏页面元素文件的平均加载时间以及所述网页解析时间和所述网页的平均解析时间;根据比较结果确定影响所述网页首屏时间的因素。

其中,本发明实施例所述的处理器401可以是一个处理器,也可以是多个处理元件的统称。例如,该处理器401可以是中央处理器(Central Processing Unit,简称CPU),也可以是特定集成电路(Application Specific Integrated Circuit,简称ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路,例如:一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)。

存储器402可以是一个存储装置,也可以是多个存储元件的统称,且用于存储可执行程序代码等。且存储器402可以包括随机存储器(RAM),也可以包括非易失性存储器(non-volatile memory),例如磁盘存储器,闪存(Flash)等。

总线404可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1