无线网页浏览资源优化方法、装置及系统的制作方法

文档序号:7790251阅读:160来源:国知局
专利名称:无线网页浏览资源优化方法、装置及系统的制作方法
技术领域
本发明涉及无线领域,尤其涉及无线网页浏览的资源优化技术。
背景技术
在移动互联网的发展浪潮中,随着智能手机、平板电脑等便携终端产业链的爆发和成熟,网页浏览、移动即时通讯、移动社区、移动支付等各类基于移动终端的应用也层出不穷,在这其中,无线网页浏览由于能够为人们即时提供新鲜、海量的资讯,是目前用户使用最普遍的移动互联网应用。目前无线网页浏览业务的基本流程为移动终端开机后建立PDP (lockage Data I^otocol,分组数据协议)连接PDP以及PDP附着,当移动终端需要发送数据时激活PDP并获取IP地址,RNC(Radio Network Controller,无线网络控制器)根据无线静态策略(该静态策略一般由运营商来设置)配置GBR(guarantee bit rate,保证比特速率),并切换到 DCH(Dedicated Channel,专用信道)状态,向移动终端发送网页分组数据。现有方案中,用户进行无线网页浏览时,RNC根据无线静态策略来配置GBR ;当GBR 过低时,网页显示时间较长,造成网页浏览的QOS低,影响用户体验;当GBR过高时,尽管保证了网页浏览的Q0S,但会造成无线资源的浪费。

发明内容
为了在用户进行无线网页浏览时,提高用户体验以及减少无线资源的浪费,本发明实施例提供一种无线网页浏览资源优化方法,包括从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;根据识别出的HTTP网页请求包,获取所述用户请求浏览的网页的网页ID ;将获取的网页ID和预先建立的网页信息表匹配;如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源。本发明实施例还提供一种无线网页浏览资源优化装置,包括识别模块,用于从接收到的网络数据包中识别出HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;获取模块,用于从所述识别模块识别出的HTTP网页请求包中获取所述用户请求浏览的网页的网页ID ;匹配模块,用于将所述获取模块获取的网页ID和预先建立的网页信息表匹配;策略模块,用于在所述匹配模块匹配成功时,从所述网页信息表中得到所述网页 ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源。
5
本发明实施例提供一种无线网络资源优化系统,包括无线网络控制器和基站,其特征在于,所述无线网络控制器用于,从接收到的网络数据包中识别出HTTP网页请求包;根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID ;将获取的网页ID和预先建立的网页信息表匹配;如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的 GBR,并将所述GBR发送给基站;所述基站用于,接收所述GBR,并根据所述GBR为所述用户分配无线网页会话的带宽资源。本发明实施例提供一种建立网页信息表的方法,包括从接收到的网络数据包中识别出HTTP网页请求包及所述HTTP网页请求包对应的 HTTP响应包,所述HTTP网页请求包是用户请求浏览网页时发送的;根据所述HTTP网页请求包,获取用户请求浏览的网页的网页ID ;通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出网页信息;建立所述网页ID和所述网页信息的关联关系。本发明实施例还提供一种建立网页信息表的装置,包括网页数据识别模块,用于从接收到的网络数据包中识别出HTTP网页请求包及所述HTTP网页请求包对应的HTTP响应包;网页ID获取模块,用于根据所述HTTP网页请求包,获取用户请求浏览的网页的网页ID ;网页信息统计模块,用于通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出网页信息;关联模块,用于将所述网页信息和网页ID关联并添加到网页信息表。本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分配GBR,实现GBR的动态调整,与现有技术方案相比,动态调整的GBR能更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中GBR过高或过低的情况的发生,提高了用户的体验并在保证网页浏览QOS的同时实现无线资源的最大化利用。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种无线网页浏览资源优化方法的流程图;图2为本发明实施例提供的一种网页信息表的示意图;图3为本发明实施例提供的一种无线网页浏览资源优化方法的流程图;图4为本发明实施例提供的一种网页信息记录添加方法流程图;图5为本发明实施例提供的一种建立网页信息表的方法流程图6为本发明实施例提供的一种建立网页信息表的装置结构图;图7为本发明实施例提供的一种无线网络控制器的结构图;图8为本发明实施例提供的无线网络控制器的记录添加模块结构图;图9为本发明实施例提供的一种无线网页浏览资源优化系统结构图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为使本领域一般技术人员更好的了解本发明实施例提供的技术方案,对网页会话 (session)的HTTP (Hyper Text Transfer Protocol,超文本传输协议)通信机制和无线网络GBR做一些简单的介绍HTTP互联网上应用最为广泛的一种网络协议,所有的WWW文件都必须遵守这个标准。HTTP协议定义了网页会话过程中Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端,HTTP协议采用了请求/响应模型。在一次完整的网页会话过程中,Web浏览器与Web服务器之间将遵循HTTP协议完成下列4个步骤(1)建立网页会话连接;在进行网页会话之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建Internet,即著名的TCP/IP协议族,因此 Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80;O) Web浏览器向Web服务器发送HTTP网页请求包;一旦建立了 TCP连接,Web浏览器根据用户请求访问的网址,就会向Web服务器发送HTTP网页请求包,HTTP网页请求包包含请求的方法、URL、协议版本、请求头部和请求数据。其中,HTTP 协议的请求方法有 GET、POST、HEAD、PUT、DELETE、OPT IONS、TRACE、CONNECT, 而网页浏览时一般只用GET方法;URL (Uniform Resource Locator,统一资源定位符)是因特网上标准的资源的地址,URL由协议、域名、请求地址三部分组成,完整地URL唯一确定了一个请求的资源,可以是页面、内容模块、文件或多媒体资源等,比如浏览网易首页= >体育频道=>意甲,它们的 URL 依次为 http://www. 163. com/ = > http //sports. 163. com/ = >http://sports. 163.com/yj八请求头部由关键字/值对组成,每行一对,关键字和值用英文冒号“”分隔。请求头部通知服务器有关于客户端请求的信息,典型的请求头有User-Agent 产生请求的浏览器类型;Accept 客户端可识别的内容类型列表;Host 请求的主机名,允许多个域名同处一个IP地址,即虚拟主机。请求数据不在GET方法中使用,而是在POST方法中使用。
(3) Web服务器接受请求并返回HTTP响应包; Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个HTTP响应包由状态行、响应头部、空行和响应数据4部分组成。(4)释放连接TCP连接。GBR是保证比特率(Guarantee Bit Rate)的缩写,具体指RNC为分组数据业务分配的最小带宽,用以满足分组数据业务的最低带宽需求。目前,无线网络的GBR都是由基站根据RNC中的无线静态策略配置的,对于无线网页浏览业务,一般为64Kbps。如图1所示,本发明实施例提供一种无线网页浏览资源优化方法,包括S101,从接收到的网络数据包中识别出HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;根据之前介绍的网页会话的HTTP通信机制,网页会话TCP连接建立后,浏览器根据用户输入的网址,发出HTTP网页请求包,Web服务器在收到HTTP网页请求包后,将用户请求的网页的网页内容以HTTP响应包的形式发送给浏览器。需要说明的是,由于网页具有分层结构,一个网页包含的内容可能有多种,例如html (Hypertext Markup Language,文本标记语言)、脚本、CSS (Cascading Style Sheet,级联样式表)以及图片,相应地,上述每一种内容对应为Web服务器上的一个资源,因此,一次网页会话过程中可能有多个HTTP网页请求包用于向Web服务器请求不同的资源,以获取整个网页的完整信息。例如第一个HTTP 网页请求包用于Web从服务器获取HTML文件,然后依次通发送HTTP网页请求包用于从Web 服务器获取图片、脚本等其他内容。需要说明的是,由于HTTP是应用层协议,而为了从网络数据包中识别出HTTP网页请求包,本发明实施例采用了 DPI技术。DPI是深度包检测(De印Packet Inspection)的缩写,所谓“深度”是和SPI(Simple Packet Inspection,简单报文识别)的层次相比较而言的,SPI仅分析数据包的传输层(层4)以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型,而DPI除了对前面的层次分析外,还增加了应用层分析(7层分析),通过对应用流中的数据报文内容进行探测,从而确定数据报文的真正应用,因为非法应用可以伪装端口号,但目前难以隐藏应用层的协议特征。具体地,在一个实施例中,可以采用DPI特征字识别的方法,对接收到的数据包头部以及数据部分进行解析,并将解析出的字段与HTTP网页请求包的对应特征字段进行匹配。具体地,若解析出数据包头部中TCP端口号为80,数据包的数据部分包含有请求方法 GET,同时协议类型为HTTP、且URL后缀名为· jsp、· asp、· php、· htm、· html、· shtml中的任何一种,就可以判定该数据包为HTTP网页请求包;当然可以理解的是,解析和匹配的字段越多,判定的结果会越准确。当然可以理解的是,从接受到的数据包中识别出HTTP网页请求包,还可以采用其他的识别技术,比如说应用层协议识别技术、关键字匹配或行为特征分析技术。S102,根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID ;需要说明的是,网页ID是用来区分不同网页的标识,且该标识是唯一的。在本发明的一个实施例中,将网页会话TCP连接建立后,接收到的首个HTTP网页请求包中的URL作为网页ID。具体地,将SlOl识别出的首个HTTP网页请求包中的特定字段进行解析,即可得到该网页的主URL,然后以此URL作为网页ID;在另一个实施例中,网页 ID也可以采用计算的方法获取将SlOl识别出的首个HTTP网页请求包中的特定字段进行解析,并提取该HTTP网页请求包中的URL和host字段,再将提取出的URL字段和host字段通过字符串连接函数连接成一个字段,最后用散列算法对连接出的字段进行散列,得出一个特定长度的序列号,并以此序列号来作为网页ID。具体地,可以采用MD5算法(消息摘要算法第五版)来作为计算网页ID的散列算法,即MD5 (URI^host)即可得出网页ID;当然可以理解的是,还可以采用其他的散列算法,如SHA-I,本发明实施例不做特别限定。S103,将获取的网页ID和预先建立的网页信息表匹配,所述网页信息表包含用户常用网页的网页ID以及每个网页ID对应的网页信息;在一个实施例中,在进行匹配时,可以将获取的网页ID作为键(key)值,采用 hash(哈希)索引的方法与网页信息表进行匹配。Hash索引的方法作为一个具体的查找方式具有迅速查找的优势,能提高匹配速度。可以理解的是hash索引的方法并不是匹配的唯一实现方式,故hash索引的方式作为一个举例不应理解为对本发明实施例的限定,可以理解的是,在另一个实施例中,还可以采用b-tree 二叉树索引、r-tree索引或full-text索引。图2所示为本发明实施例提供的一种网页信息表的示意图。根据图2,网页的具体信息包括但不限于网页大小、网页层次、网页类型。其中,网页大小为整个网页包含的数据量;网页层次具体与网页的目录结构对应,第一级目录为主页,层数为1,二级目录中的子网页层数为2,以此类推;网页类型用于表示网页的内容主题,比如新闻、体育或财经等。需要说明的是,图2仅仅是本发明实施例的一个网页信息数据表的举例,图2所示的网页信息表只是提供了网页信息表实现的一种典型方式,不是唯一的,可以在此表的基础上进行优化和完善。例如,在一个实施例中,如果需要考虑网页的字符集、作者、版本、网页关键字等因素,就可以在网页信息表中添加这些相应信息。需要说明的是,网页信息表可以是固定不变的,也可以根据用户的访问情况进行更新。S104,如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源。具体地,在一个实施例中,根据网页信息计算与之匹配的GBR的方法包括(1)从所述网页信息中获取网页大小和网页层次;(2)用网页大小除以标准时间,得到与所述网页信息匹配的GBR ;或者网页大小除以网页层次,再除以标准时间,得到与所述网页信息匹配的GBR;或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹配的GBR。其中,标准时间是由运营商静态配置的,比如ls,它代表用户获得一个完整的网页信息所需的平均时间;用户等级系数是根据用户类型来设置的,例如金牌用户=1,银牌用户=2,铜牌用户=3。具体地,上述计算方法可以用公式表示为GBR =网页大小/标准时间;在另一个实施例中,GBR的计算方法可以为GBR =网页大小/标准时间*网页层次;在另一个实施例中,GBR的计算方法还可以GBR =网页大小/标准时间*网页层次/用户等级系数。GBR计算完成后,RNC将该GBR以GBR配置文件的形式下发给基站,基站按照GBR 配置文件分配网页会话的带宽资源,从而实现GBR根据网页信息进行动态调整。本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分配GBR,实现GBR的动态调整,与现有技术方案相比,动态调整的GBR能更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中GBR过高或过低的情况,提高了用户的体验并在保证网页浏览 QOS的同时实现无线资源的最大化利用。如图3所示,本发明实施例提供一种无线网页浏览资源优化方法,包括S301,从接收到的网络数据包中识别出HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;在一个实施例中,可以采用DPI特征字识别的方法,对接收到的数据包头部以及数据部分进行解析,并将解析出的字段与HTTP网页请求包的对应特征字段进行匹配。具体地,若解析出数据包头部中TCP端口号为80,数据包的数据部分包含有请求方法GET,同时协议类型为HTTP、且URL后缀名为· jsp、· asp、· php、· htm、· html、· shtml中的任何一种, 就可以判定该数据包为HTTP网页请求包;当然可以理解的是,解析和匹配的字段越多,判定的结果会越准确。S302,根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID ;需要说明的是,网页ID是用来区分不同网页的标识,且该标识是唯一的。在本发明的一个实施例中,将网页会话TCP连接建立后,接收到的首个HTTP网页请求包中的URL作为网页ID。具体地,将SlOl识别出的首个HTTP网页请求包中的特定字段进行解析,即可得到该网页的主URL,然后以此URL作为网页ID;在另一个实施例中,网页 ID也可以采用计算的方法获取将SlOl识别出的首个HTTP网页请求包中的特定字段进行解析,并提取该HTTP网页请求包中的URL和host字段,再将提取出的URL字段和host字段通过字符串连接函数连接成一个字段,最后用散列算法对连接出的字段进行散列,得出一个特定长度的序列号,并以此序列号来作为网页ID。具体地,可以采用MD5算法(消息摘要算法第五版)来作为计算网页ID的散列算法,即MD5 (URI^host)即可得出网页ID ;当然可以理解的是,还可以采用其他的散列算法,如SHA-I,本发明实施例不做特别限定。S303,将获取的网页ID和预先建立的网页信息表匹配,所述网页信息表包含用户常用网页的网页ID以及每个网页ID对应的网页信息;在一个实施例中,在进行匹配时,可以将获取的网页ID作为键(key)值,采用 hash(哈希)索引的方法与网页信息表进行匹配。hash索引的方法作为一个具体的查找方式具有迅速查找的优势,能提高匹配速度。可以理解的是hash索引的方法并不是匹配的唯一实现方式,故hash索引的方式作为一个举例不应理解为对本发明实施例的限定,可以理解的是,在另一个实施例中,还可以采用b-tree 二叉树索引、r-tree索引或full-text索引。图2所示为本发明实施例提供的一种网页信息表的示意图。根据图2,网页的具体信息包括但不限于网页大小、网页层次、网页类型。其中,网页大小指整个网页包含的数据量;网页层次具体与网页的目录结构对应,第一级目录为主页,层数为1,二级目录中的子网页层数为2,以此类推;网页类型用于表示网页的内容主题,比如新闻、体育或财经等。需要说明的是,图2仅仅是本发明实施例的一个网页信息数据表的举例,图2所示的网页信息表只是提供了网页信息表实现的一种典型方式,不是唯一的,可以在此表的基础上进行优化和完善。例如,在一个实施例中,如果需要考虑网页的字符集、作者、版本、网页关键字等因素,就可以在网页信息表中添加这些相应信息。S304,如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源;具体地,在一个实施例中,根据网页信息计算匹配的GBR的方法包括(1)从所述网页信息中获取网页大小和网页层次;(2)用网页大小除以标准时间,得到与所述网页信息匹配的GBR ;或者网页大小除以网页层次,再除以标准时间,得到与所述网页信息匹配的GBR;或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹配的GBR。其中,标准时间是由运营商静态配置的,比如ls,它代表用户获得一个完整的网页信息所需的平均时间,用户等级系数是根据用户类型来设置的,例如金牌用户=1,银牌用户=2,铜牌用户=3。具体地,上述计算方法可以用公式表示为GBR =网页大小/标准时间;在另一个实施例中,GBR的计算方法可以为GBR =网页大小/标准时间*网页层次;在另一个实施例中,GBR的计算方法还可以GBR =网页大小/标准时间*网页层次/用户等级系数。GBR计算完成后,将该GBR以GBR配置文件的形式下发给基站,基站按照GBR配置文件分配网页会话的带宽资源,从而实现GBR根据网页信息进行动态调整。S305,如果匹配不成功,将预先配置的GBR发送给基站,以使所述基站根据所述预先配置的GBR为所述用户分配无线网页会话的带宽资源;在一个实施例中,如果匹配不成功,说明当前访问的网页信息并没有记录在网页信息表中,这时就将预先配置的GBR(由用户配置,例如641cbpS)以GBR配置文件的形式下发给基站,基站按照该GBR配置文件分配网页会话的带宽。在另一个实施例中,如图3的虚线框所示,本发明实施例提供的无线网页浏览资源优化方法还包括S306,将匹配不成功的网页ID及对应的网页信息作为新的记录添加到网页信息表中。在一个实施例中,如果匹配不成功,说明当前访问的网页在网页信息表中并没有记录,属于一个新的网页,为了使后续用户访问该网页时能进行资源的优化,需要添加此新的网页的网页信息到网页信息表中,为计算GBR提供依据。在一个实施例中,如图4所示,S306具体包括S3601,从接收到的网络数据包中识别出与所述HTTP网页请求包对应的HTTP响应包;需要说明的是,根据网页浏览的HTTP通信机制,Web服务器收到Web浏览器发出 HTTP网页请求包后,会将Web浏览器请求的资源以HTTP响应包形式发送给浏览器,即一个 HTTP网页请求包对应一个HTTP响应包,因此,在一个实施例中,可以按照以下规则来简单识别出HTTP响应包浏览器发出HTTP网页请求包之后收到的下一个数据包即为该HTTP网页请求包对应的HTTP响应包。因此,根据步骤S301中描述的方法识别出HTTP网页请求包之后,即可识别出其对应的HTTP响应包。在另一个实施例中,也可以采用DPI特征字识别的方法,对网络数据包的内容进行解析和匹配,从而识别出HTTP响应包。
S3602,解析识别出的HTTP网页请求包对应的HTTP响应包,统计出用户请求浏览的网页的网页信息;为了便于描述,本发明实施例将HTTP网页请求包和HTTP响应包统称为网页浏览数据包,需要说明的是,在进行网页浏览的时候,一个session(会话)至少包含一条数据流,而一条数据流包含多个网页浏览数据包,因此对识别出的网页浏览数据包进行解析主要分为两个层次(1)解析出哪些网页浏览数据包属于同一条数据流;(2)从多条数据流中解析出哪些数据流属于同一 session ;实现上述两个个层次的解析方法同样可以采用S301 中的DPI特征字识别的方法。具体地,在一个实施例中,解析网页浏览数据包中的五元组(源IP地址,源端口, 目的IP地址,目的端口,和传输层协议号),如果两个网页浏览数据包的五元组满足以下两个条件中的任何一种,就可以判定这两个数据包属于同一条数据流;(1)两个数据包的五元组完全相同;(2) 一个数据包五元组中的源IP地址为另一个数据包五元组中目的IP地址,且目的IP地址为另一个数据包的源IP地址,其余三个参数完全相同。进一步地,对不同数据流的HTTP网页请求包进行解析,得到Src和URL字段的值, Src和URL完全相同的的数据流就判定为属于同一个session。在一个实施例中,统计网页大小的方法为先建立session表和数据流表,然后在上述解析数据包的过程中将每个网页浏览数据包的大小和归属信息记录到session表和流表中(具体地,数据包的大小以及数据包属于哪条数据流这两个信息记载到数据流表, 数据包所在流属于哪个session这一信息记载到session表),最后结合上述两个表中记载的信息统计出网页大小;同时,可以通过解析主URL来统计网页层次和网页类型,所述主 URL为session中第一个HTTP网页请求包的URL。具体地,根据主URL中斜杠的数量来判断网页层次,根据URL中的关键字来判断网页的类型,例如URL为/news/lady/default, jsp ? user = abc&refer = http://www. 163. com/lady,根据斜杠的数量来判断网页层次(从URL 开头到问号结束,没有问号则到空格结束),此处共有3个斜杠,则说明此网页为第三层网页;解析斜杠之间的内容,可以获得关键字,比如news、lady,则说明此网页时女性、新闻类型。如果没有关键字则表示是网站主页,类型字段给空。S3603,将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页ID关联并添加到所述网页信息表。本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分配GBR,实现GBR的动态调整,与现有技术方案相比,动态调整的GBR能更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中GBR过高或过低的情况,提高了用户的体验,并在保证网页浏览 QOS的同时实现无线资源的最大化利用;进一步地,当匹配不成功的时候,通过将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表,后续其他用户访问时,就可以对其合理分配GBR,实现无线资源的优化。如图5所示,本发明实施例提供一种建立网页信息表的方法,包括S501,从接收到的网络数据包中识别出HTTP网页请求包及所述HTTP网页请求包对应的HTTP响应包,所述HTTP网页请求包是用户请求浏览网页时发送的;
12,在一个实施例中,可以预先设置一块信息缓存,当网络数据包到达时,将数据包复制到信息缓存中,然后对数据包进行特征字的识别和解析,若解析出数据包头部中TCP端口号为80,数据包的数据部分包含有请求方法GET,同时协议类型为HTTP、且URL 后缀名为.jsp、. asp、. php、. htm、. html、. shtml中的任何一种,就可以判定该数据包为 HTTP网页请求包,当然可以理解的是,根据之前所述的网页浏览HTTP通信机制,浏览器发送一个HTTP网页请求包之后收到的下一个网络数据包必然为与该HTTP网页请求包对应的 HTTP响应包;S502,根据所述HTTP网页请求包,获取用户请求浏览的网页的网页ID,并通过解析所述HTTP响应包,统计得出网页信息;在本发明的一个实施例中,将识别出的首个HTTP网页请求包中的URL作为网页 ID。具体地,将S501识别出的首个HTTP网页请求包中的特定字段进行解析,即可得到该网页的主URL,然后以此URL作为网页ID ;在另一个实施例中,网页ID也可以采用计算的方法获取将SlOl识别出的首个HTTP网页请求包中的特定字段进行解析,并提取该HTTP网页请求包中的URL和host字段,再将提取出的URL字段和host字段通过字符串连接函数连接成一个字段,最后用散列算法对连接出的字段进行散列,得出一个特定长度的序列号,并以此序列号来作为网页ID。具体地,可以采用MD5算法(消息摘要算法第五版)来作为计算网页ID的散列算法,即MD5(URL+host)即可得出网页ID ;当然可以理解的是,还可以采用其他的散列算法,如SHA-I,本发明实施例不做特别限定。对识别出的HTTP响应包进行解析主要分为两个层次(1)解析出哪些HTTP响应包属于同一条数据流;(2)从多条数据流中解析出哪些数据流属于同一 session ;实现上述两个个层次的解析方法同样可以采用SlOl中的DPI特征字解析的方法。具体地,在一个实施例中,解析HTTP响应包中的五元组(源IP地址,源端口,目的 IP地址,目的端口,和传输层协议号),如果两个HTTP响应包的五元组完全相同,就可以判定这两个数据包属于同一条数据流;进一步地,对不同数据流的HTTP网页请求包进行解析,得到Src和URL字段的值, Src和URL完全相同的的数据流就判定为属于同一个session。在一个实施例中,获取网页大小的方法为先建立session表和数据流表,然后在S501识别数据包和判断的过程中将每个网页浏览数据包的大小和归属信息记录到 session表和流表中(具体地,数据包的大小以及数据包属于哪条数据流这两个信息记载到数据流表,数据包所在流属于哪个session这一信息记载到session表),最后结合上述两个表中记载的信息统计出网页大小;同时,可以通过解析主URL来获取网页层次和网页类型,所述主URL为session中第一个HTTP网页请求包的URL。具体地,根据主URL中斜杠的数量来判断网页层次,根据URL中的关键字来判断网页的类型,例如URL为/news/lady/ default, jsp ? user = abc&refer = http: //www. 163. com/lady,根据斜杠的数量来判断网页层次(从URL开头到问号结束,没有问号则到空格结束),此处共有3个斜杠,则说明此网页为第三层网页;解析斜杠之间的内容,可以获得关键字,比如news、lady,则说明此网页时女性、新闻类型,如果没有关键字则表示是网站主页,类型字段给空。S503,建立所述网页ID和所述网页信息的关联关系。本发明实施例通过以上技术方案,基于DPI识别的方法,对网络数据包做深入解析,保证了解析的准确性,同时,根据解析的结果来统计网页信息,将解析到的结果作为网页信息记录添加到网页信息表中,方便后续访问该网页时直接获取网页的具体信息。如图6所示,本发明实施例提供一种建立网页信息表的装置,包括网页信息识别模块610,用于从接收到的网络数据包中识别出HTTP网页请求包及所述HTTP网页请求包对应的HTTP响应包;网页ID获取模块620,用于根据所述HTTP网页请求包,获取用户请求浏览的网页的网页ID,网页信息统计模块630,用于通过解析所述HTTP网页请求包对应的HTTP响应包, 统计得出网页信息;关联模块640,用于将所述网页信息和网页ID关联并添加到网页信息表。进一步地,在一个实施例中,获取模块620具体包括特征字单元6201,用于将所述HTTP网页请求包中的URL和host字段,通过字符串连接函数连接成一个特征字段;序列号单元6202,用于用散列算法对所述特征字段进行散列得到一个特定长度的序列号;网页ID单元6203,用于将所述一个特定长度的序列号作为所述网页ID。本发明实施例通过以上技术方案,基于DPI识别的方法,对网络数据包做深入解析,保证了解析的准确性,同时,根据解析的结果来统计网页信息,将解析到的结果作为网页信息记录添加到网页信息表中,方便后续访问该网页时直接获取网页的具体信息。如图7所示,本发明的实施例提供一种无线网页浏览资源优化装置,包括识别模块710,用于从接收到的网络数据包中识别出HTTP网页请求包;在一个实施例中,识别模块可以采用特征字识别的方法,对接收到的数据包头部以及数据部分进行解析,并将解析出的字段与HTTP网页请求包的对应特征字段进行匹配。 具体地,若解析出数据包头部中TCP端口号为80,数据包的数据部分包含有请求方法GET, 同时协议类型为HTTP、且URL后缀名为· jsp、· asp、· php、· htm、· html、· shtml中的任何一种,就可以判定该数据包为HTTP网页请求包;当然可以理解的是,解析和匹配的字段越多, 判定的结果会越准确。 获取模块720,用于根据识别模块610识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID ; 在本发明的一个实施例中,获取模块720将网页会话TCP连接建立后,接收到的首个HTTP网页请求包中的URL作为网页ID。具体地,将识别模块710识别出的首个HTTP网页请求包中的特定字段进行解析,即可得到该网页的主URL,然后以此URL作为网页ID ;在另一个实施例中,网页ID也可以采用计算的方法获取将识别模块710识别出的首个HTTP网页请求包中的特定字段进行解析,并提取该HTTP网页请求包中的URL和host字段,再将提取出的URL字段和host字段通过字符串连接函数连接成一个字段,最后用散列算法对连接出的字段进行散列,得出一个特定长度的序列号,并以此序列号来作为网页ID。具体地,可以采用MD5算法(消息摘要算法第五版)来作为计算网页ID的散列算法,即MD5 (URL+host) 即可得出网页ID;当然可以理解的是,还可以采用其他的散列算法,如SHA-1,本发明实施例不做特别限定。
14
匹配模块730,用于将获取模块720获取的网页ID和预先建立的网页信息表匹配, 所述网页信息表包含用户常用网页的网页ID以及每个网页ID对应的网页信息;在一个实施例中,匹配模块730可以将获取模块720获取的网页ID作为键(key) 值,采用hash(哈希)索引的方法与网页信息表进行匹配。hash索引的方法作为一个具体的查找方式具有迅速查找的优势,能提高匹配速度。可以理解的是hash索引的方法并不是匹配的唯一实现方式,故hash索引的方法作为一个举例不应理解为对本发明实施例的限定。策略模块740,用于在匹配模块730匹配成功时,根据网页信息表中的网页信息计算与所述网页信息匹配的GBR,并将该GBR发送给基站,以使基站按照该GBR分配无线网页会话的带宽资源。进一步地,策略模块740还用于在匹配模块730匹配不成功时,将预先配置的GBR 下发给基站,以使基站按照该GBR分配无线网页会话的带宽资源。在一个实施例中,如果匹配模块730匹配成功,则说明该网页ID对应的网页信息在网页信息表中表中已有记录,所以策略模块740可以根据网页信息表中与该网页ID匹配的网页信息来计算GBR,并将计算出的GBR以GBR配置文件的形式发送给基站进行无线网页会话带宽资源的分配。具体地,在一个实施例中,根据网页信息计算匹配的GBR的方法包括(1)从所述网页信息中获取网页大小和网页层次;(2)用网页大小除以标准时间,得到与所述网页信息匹配的GBR ;或者网页大小除以网页层次,再除以标准时间,得到与所述网页信息匹配的GBR;或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹配的GBR。其中,标准时间是由运营商静态配置的,比如ls,它代表用户获得一个完整的网页信息所需的平均时间;用户等级系数是根据用户类型来设置的,例如金牌用户=1,银牌用户=2,铜牌用户=3。具体地,上述计算方法可以用公式表示为GBR=网页大小/标准时间;在另一个实施例中,GBR的计算方法可以为GBR =网页大小/标准时间*网页层次;在另一个实施例中,GBR的计算方法还可以GBR =网页大小/标准时间*网页层次/用户等级系数。GBR计算完成后,策略模块740将该GBR以GBR配置文件的形式下发给基站,基站按照GBR配置文件分配网页会话的带宽资源,从而实现GBR根据网页信息进行动态调整。如图7中的虚线框所示,在一个实施例中,该无线网页浏览资源优化装置还包括记录添加模块750,用于将匹配不成功的网页ID及对应的网页信息作为新的记录添加到网页信息表中;进一步地,如图8所示,在一个实施例中,记录添加模块750具体包括第一识别单元7501,用于从接收到的网络数据包中识别出与所述HTTP网页请求包对应的HTTP响应包;在一个实施例中,识别单元7501可以按照以下规则来简单识别出HTTP响应包浏览器发出HTTP网页请求包之后收到的下一个数据包即为该HTTP网页请求包对应的HTTP 响应包。在另一个实施例中,识别单元7501也可以采用DPI特征字识别的方法,对网络数据包的内容进行解析和匹配,从而识别出HTTP响应包。解析统计单元7502,用于解析识别单元7501识别出的HTTP网页请求包对应的 HTTP响应包,并统计出网页信息;存储单元7503,用于将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页ID关联并添加到所述网页信息表。本发明实施例通过以上技术方案,基于网页数据的识别,通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分配GBR,实现GBR的动态调整,与现有技术方案相比,动态调整的GBR能更好地跟不同的网页浏览业务相匹配, 较大地减少了现有技术中GBR过高或过低的情况,提高了用户的体验,并在保证网页浏览 QOS的同时实现无线资源的最大化利用;进一步地,通过记录添加模块将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表,实现网页信息表的更新,这样当后续其他用户访问再访问该网页时,就可以计算出匹配的GBR,实现资源的优化。如图9所示,本发明实施例提供一种无线网络资源优化系统,包括无线网络控制器80,所述无线网络控制器80为本发明实施例所述的无线网络控制器;基站90,所述基站用于接收无线网络控制器80发出的GBR,并根据该GBR为用户分配网页会话的带宽。本发明实施例通过以上技术方案,无线网络控制器基于网页数据的识别,通过查询网页信息表获取用户访问的网页的网页信息,并根据每个网页的具体信息来计算并分配 GBR,实现GBR的动态调整,与现有技术方案相比,动态调整的GBR能更好地跟不同的网页浏览业务相匹配,较大地减少了现有技术中GBR过高或过低的情况,提高了用户的体验,并在保证网页浏览QOS的同时实现无线资源的最大化利用;进一步地,无线网络控制器通过记录添加模块将之前网页信息表没有记录的网页信息在访问的时候添加到网页信息表,实现网页信息表的更新,这样当后续其他用户访问再访问该网页时,无线网络控制器就可以根据更新后的网页信息表,计算出匹配的GBR,并下发给基站进行无线资源的配置,实现资源的优化。以上所述仅为本发明的几个实施例,本领域的技术人员依据申请文件公开的可以对本发明进行各种改动或变型而不脱离本发明的精神和范围。
权利要求
1.一种无线网页浏览资源优化方法,其特征在于,包括从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;根据识别出的HTTP网页请求包,获取所述用户请求浏览的网页的网页标识ID ;将获取的网页ID和预先建立的网页信息表匹配;如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源。
2.如权利要求1所述的方法,其特征在于,所述根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID,包括将所述HTTP网页请求包中的统一资源定位符URL和host字段,通过字符串连接函数连接成一个特征字段;用散列算法对所述特征字段进行散列得到一个特定长度的序列号;将所述一个特定长度的序列号作为所述用户请求浏览的网页的网页ID。
3.如权利要求2所述的方法,其特征在于,所述散列算法为消息摘要算法第五版MD5或者安全散列算法SHA-I。
4.如权利要求1所述的方法,其特征在于,所述根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID,包括将所述HTTP网页请求包中的统一资源定位符URL字段作为所述用户请求浏览的网页的网页ID。
5.如权利要求1-4任一项所述的方法,其特征在于,所述网页信息表中的网页信息包括网页大小、网页层次和/或网页类型。
6.如权利要求5所述的方法,其特征在于,所述根据所述网页信息计算出与所述网页信息匹配的GBR,包括从所述网页信息中获取网页大小和网页层次;用网页大小除以标准时间,得到与所述网页信息匹配的GBR,所述标准时间为用户获得一个完整的网页信息所需的平均时间;或者网页大小除以网页层次,再除以标准时间,得到与所述网页信息匹配的GBR;或者用网页大小除以网页层次,再除以用户等级系数,得到与所述网页信息匹配的GBR。
7.如权利要求1-6任一项所述的方法,其特征在于,还包括如果匹配不成功,将预先配置的GBR发送给基站,以使所述基站根据所述预先配置的 GBR为所述用户分配无线网页会话的带宽资源。
8.如权利要求7所述的方法,其特征在于,如果匹配不成功,将预先配置的GBR下发给基站之后,还包括将匹配不成功的网页ID及对应的网页信息作为新的记录添加到网页信息表中。
9.如权利要求8所述的方法,其特征在于,所述将匹配不成功的网页ID及对应的网页信息作为新的记录添加到网页信息表中,具体包括从接收到的网络数据包中识别出与所述HTTP网页请求包对应的HTTP响应包;通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出所述用户请求浏览的网页的网页信息;将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页ID关联并添加到所述网页信息表。
10.如权利要求1所述的方法,其特征在于,所述从接收到的网络数据包中识别出HTTP 网页请求包,包括通过对所述接收到的网路数据包进行深度包检测DPI,从接收到的网络数据包中识别出HTTP网页请求包。
11.一种无线网页浏览资源优化装置,包括识别模块,用于从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;获取模块,用于从所述识别模块识别出的HTTP网页请求包中获取所述用户请求浏览的网页的网页标识ID ;匹配模块,用于将所述获取模块获取的网页ID和预先建立的网页信息表匹配; 策略模块,用于在所述匹配模块匹配成功时,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站,以使所述基站按照所述GBR为所述用户分配无线网页会话的带宽资源。
12.如权利要求11所述的装置,其特征在于,还包括记录添加模块,用于在所述匹配模块匹配不成功时,将匹配不成功的网页ID及对应的网页信息作为新的记录添加到所述网页信息表中。
13.如权利要求12所述的装置,其特征在于,所述记录添加模块具体包括识别单元,从接收到的网络数据包中识别出与所述HTTP网页请求包对应的HTTP响应包;解析统计单元,用于通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出所述用户请求浏览的网页的网页信息;存储单元,用于将所述用户请求浏览的网页的网页信息和所述用户请求浏览的网页的网页ID关联并添加到所述网页信息表。
14.如权利要求13所述的装置,其特征在于,所述识别单元具体用于,通过对所述接收到的网路数据包进行深度包检测DPI,从接收到的网络数据包中识别出HTTP网页请求包。
15.一种无线网络资源优化系统,包括无线网络控制器和基站,其特征在于, 所述无线网络控制器用于,从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包,所述HTTP网页请求包是用户请求浏览网页时发送的;根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页标识ID ;将获取的网页ID和预先建立的网页信息表匹配;如果匹配成功,从所述网页信息表中得到所述网页ID对应的网页信息,根据所述网页信息计算出与所述网页信息匹配的保证比特速率GBR,并将所述GBR发送给基站;所述基站用于,接收所述GBR,并根据所述GBR为所述用户分配无线网页会话的带宽资源。
16.如权利要求15所述的系统,其特征在于,所述无线网络控制器还用于,当获取的网页ID和预先建立的网页信息表匹配不成功时,将预先配置的GBR下发给基站进行无线资源配置。
17.如权利要求15所述的系统,其特征在于,所述无线网络控制器还用于,当获取的网页ID和预先建立的网页信息表匹配不成功时,将预先配置的GBR下发给基站进行无线资源配置,并将匹配不成功的网页ID及对应的网页信息作为新的记录添加到网页信息表中。
18.一种建立网页信息表的方法,其特征在于,包括从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包及所述HTTP网页请求包对应的HTTP响应包,所述HTTP网页请求包是用户请求浏览网页时发送的; 根据所述HTTP网页请求包,获取用户请求浏览的网页的网页标识ID ; 通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出网页信息; 建立所述网页ID和所述网页信息的关联关系。
19.如权利要求18所述的方法,其特征在于,所述根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID,包括将所述HTTP网页请求包中的统一资源定位符URL和host字段,通过字符串连接函数连接成一个特征字段;用散列算法对所述特征字段进行散列得到一个特定长度的序列号; 将所述一个特定长度的序列号作为所述网页ID。
20.如权利要求18或19所述的方法,其特征在于,所述网页信息包括网页大小、网页层次和/或网页类型。
21.一种建立网页信息表的装置,其特征在于,包括网页数据识别模块,用于从接收到的网络数据包中识别出超文本传输协议HTTP网页请求包及所述HTTP网页请求包对应的HTTP响应包;网页ID获取模块,用于根据所述HTTP网页请求包,获取用户请求浏览的网页的网页标识ID ;网页信息统计模块,用于通过解析所述HTTP网页请求包对应的HTTP响应包,统计得出网页信息;关联模块,用于将所述网页信息和网页ID关联并添加到网页信息表。
22.如权利要求21所述的装置,其特征在于,所述获取模块包括特征字单元,用于将所述HTTP网页请求包中的统一资源定位符URL和host字段,通过字符串连接函数连接成一个特征字段;序列号单元,用于用散列算法对所述特征字段进行散列得到一个特定长度的序列号; 网页ID单元,用于将所述一个特定长度的序列号作为所述网页ID。
全文摘要
本发明实施例公开一种无线网页浏览资源优化方法,包括从接收到的网络数据包中识别出HTTP网页请求包;根据识别出的HTTP网页请求包,获取用户请求浏览的网页的网页ID;将该网页ID和预先建立的网页信息表匹配;若匹配成功,从网页信息表中得到该网页ID对应的网页信息,根据网页信息计算出与该网页信息匹配的GBR,并将该GBR发送给基站,以使基站根据该GBR为用户分配无线网页会话的带宽资源。相应地,本发明实施例还公开了一种建立网页信息表的方法、无线网页浏览资源优化装置以及无线网络资源优化系统,通过以上技术方案,能根据每个网页的具体信息来计算并分配GBR,实现无线网页浏览时的资源的优化。
文档编号H04L29/08GK102523296SQ201110433000
公开日2012年6月27日 申请日期2011年12月21日 优先权日2011年12月21日
发明者周韡, 张洪丁 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1