一种在网络设备中用于优化网页的方法和设备的制作方法

文档序号:7767308阅读:192来源:国知局
专利名称:一种在网络设备中用于优化网页的方法和设备的制作方法
技术领域
本发明涉及计算机网络技术,尤其涉及一种在网络设备中用于优化网页的方法和 设备。
背景技术
现如今,通过各种用户设备浏览网页,已成为多数人生活中的一部分,然而,随着 互联网的发展,网页中包含的信息越来越多,使得用户不得不花费精力在网页中查找自己 需要的信息,并且,为了创造盈利,网站提供的各种网页中往往夹杂着较多的广告,影响了 用户的浏览。此外,由于部分网站的网页编写不得当,还会造成用户网页加载量偏大、网页 生成速度较慢的问题。
现有技术中,已提供了屏蔽广告信息的方法,然而,该类方法往往仅通过屏蔽浮动 元素、拦截弹出窗口等简单的手段来进行广告屏蔽,不仅屏蔽效果较弱,还有可能屏蔽用户 需要的信息。而对于网页编写不当造成的网页加载量偏大、网页排版速度较慢等问题,现有 技术尚未提供有效的解决方案。发明内容
本发明的目的是提供一种在网络设备中用于优化网页的方法和设备。
根据本发明的一个方面,提供一种网络设备中用于优化网页的方法,其中,该方法 包括以下步骤
a获取待处理的第一网页信息;
b分析所述第一网页信息所包含的各个信息单元,以确定所述各个信息单元所属 的类别;
c基于第一预定规则,结合所述各个信息单元的类别,来将所述第一网页信息转换 为用于提供给所述用户设备的第二网页信息。
根据本发明的另一个方面,还提供了一种用于优化网页的网络设备,其中,该网络 设备包括
获取装置、用于获取所述待处理的第一网页信息;
类别分析装置、用于分析所述第一网页信息所包含的各个信息单元,以确定所述 各个信息单元所属的类别;
转换装置、用于基于第一预定规则,结合所述各个信息单元的类别,来将所述第一 网页信息转换为用于提供给所述用户设备的第二网页信息。
与现有技术相比,本发明具有以下优点1)能够突显用户关注的内容,减少用户 查找的时间;2)能够屏蔽广告内容及用户不关注的内容,带来更好的网页浏览体验;3)能 够去除网页中的冗余内容,减少网页的加载时间;4)能够调整网页结构,加快网页的排版速度。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显
图1为本发明一个方面的用于优化网页的系统网络拓扑图2为本发明一个优选实施例的用于优化网页的系统网络拓扑图3为本发明一个方面的用于优化网页的方法的流程图4为本发明一个优选实施例的用于优化网页的方法的流程图5为本发明另一优选实施例的用于优化网页的方法的流程图6为本发明再一个优选实施例的用于优化网页的方法的流程图7为本发明一个方面的用于优化网页的网络设备结构图8为本发明一个优选实施例的用于优化网页的网络设备结构图9为本发明另一优选实施例的用于优化网页的网络设备结构图10为本发明再一个优选实施例的用于优化网页的网络设备结构附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个方面的用于优化网页的系统网络拓扑图。用户通过用户设备1 与网络设备2进行交互,网络设备2根据用户的交互行为,获取网页信息,并将该获取的网 页信息优化后,经由用户设备1提供给用户。其中,用户设备1包括但不限于计算机、智能 手机、PDA或IPTV。网络设备2包括但不限于单个网络服务器、多个网络服务器组成的服 务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云 计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
图2为本发明一个优选实施例的用于优化网页的系统网络拓扑图。本实施例中, 网络设备2进一步分为web设备及优化设备。用户通过用户设备1与web设备进行交互, web设备根据用户的交互行为,获取网页信息,并将该网页信息发送给优化设备,优化设备 对该网页信息进行优化后,反馈给web设备,web设备再将该优化后的网页信息提供给用户 设备1,以使用户设备1根据该网页信息,将网页呈现给用户。其中,用户设备1包括但不 限于计算机、智能手机、PDA或IPTV。Web设备及优化涉笔均包括但不限于单个网络服务 器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或 网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成 的一个超级虚拟计算机。
请参阅图1及图3,图3为本发明一个方面的用于优化网页的方法的流程图。
在步骤Sl中,用户通过任何一种可与用户设备1进行人机交互的交互设备来输入 第一请求,其中,该第一请求用于为用户设备1请求处理待处理的第一网页信息,例如,用 于为用户设备1请求用户希望浏览的网页信息,或者,用于为用户设备1请求已存储在用户 设备1上但需要优化的网页信息等。其中,该交互设备可以是键盘、鼠标、遥控器、触摸板或 声控设备等,用户可以通过执行预设的操作方式告知用户设备1发送所述请求。例如,以触 摸板式人机交互设备为例,用户通过触控触摸板,选择用户设备1所显示的某个网页链接,再例如,用户1通过在触摸板上以预设的轨迹滑动,以打开与该预设的轨迹相应的网页,例 如,主页等。当然,本领域技术人员应该理解,上述交互设备仅仅只是例举,而非用于限制本 发明,事实上,其他可供用户用于输入请求的交互设备或方式也均适用于本发明,并以引用 方式包含于此,而不做赘述。
接着,在步骤S2中,所述用户设备1将所述用户输入的第一请求发送至所述网络 设备2。其中,用户设备1和网络设备2之间的信息收发通过网络进行,该网络包括但不 限于1)有线网络;2)无线网络;3)局域网;4)广域网;5)VPN网络;6)无线自组织网络 (AdHoc网络)等。
接着,在步骤S3中,网络设备2获取待处理的第一网页信息。网络设备2获取待 处理的第一网页信息的方式包括多种
1)当用户设备1发送的第一请求中包括第一网页信息的全部内容,则网络设备2 获取该第一请求后,从该第一请求中直接提取第一网页信息;
2)当用户设备1发送的第一请求中仅包括第一网页信息的链接地址,则网络设备 2获取该第一请求后,从所述第一请求中提取所述待处理的第一网页信息的链接地址,再根 据所述链接地址,从相应的网站中获取所述待处理的第一网页信息。
接着,在步骤S4中,网络设备2分析所述第一网页信息所包含的各个信息单元,以 确定所述各个信息单元所属的类别。
具体地,网络设备2对所述第一网页信息进行分析,识别出第一网页信息中需要 处理的信息单元,并通过分析与信息单元相关的因素,来确定各个信息单元所属的类别。
其中,网络设备2可根据以下至少一项因素来确定所述信息单元的类别
1)所述信息单元的标识符;
具体地,网络设备2根据第一网页信息中所包含的标识符,来区分信息单元,并判 断信息单元所属的类别。
例如,若网络设备2检测到标识符“〈title〉”,则网络设备2判断两个标识符 “〈title〉”之间的内容为一个信息单元,该信息单元为标题;又例如,若网络设备2检测到 标识符“ /* ”或者“ // ”,则网络设备2判断“ /* ”或者“ // ”至“;”之间的内容为一个信息 单元,该信息单元为注释单元等。
2)所述信息单元的文本内容;
具体地,网络设备2根据第一网页信息中所包含的标识符,来区分信息单元,随 后,根据该信息单元的文本内容,来判断信息单元所属的类别。
例如,网络设备2将信息单元中的文本内容与预设的广告词库中包含的广告词匹 配,若匹配成功,例如匹配得到“欢迎选购”等,则判断该信息单元为广告单元。
3)所述信息单元在所述第一网页信息中的位置;
具体地,网络设备2根据第一网页信息中所包含的标识符,来区分信息单元,随 后,网络设备2通过该信息单元在第一网页信息中的位置,来判断信息单元所属的类别;
例如,网络设备2分析得到超过一定数量的,结构相近的信息单元位于第一网页 信息后1/5位置内,则判断该信息单元为广告单元。
4)与所述单元相关的信息单元的信息;
具体地,网络设备2根据第一网页信息中所包含的标识符来区分信息单元,随后,网络设备2通过查找与该信息单元具有相同标识符的信息单元的类别或查找与该信息单 元位置相近且结构相似的信息单元的类别或包含的内容,来判断该信息单元所属的类别。 其中,所述结构相似是指两个信息单元中相同的部分超过一预定阈值,例如,超过50%等。 在此,本领域技术人员应可根据实际需求来确定一个合理的预定阈值。
例如,网络设备2在判断一信息单元时,首先查找到其前一信息单元;随后,将其 与待判断的信息单元进行对比,当两者标识符相同,且两者的文本匹配度高于一预定阈值, 则判断该信息单元的类别与前一信息单元的类别相同。
需要说明的是,网络设备2在判断信息单元的类别的过程中,可综合上述因素进 行判断,例如,当网络设备2检索到信息单元的文本内容与广告词库中的广告词相匹配,则 再进一步判断该信息单元在第一网页中的位置及该信息单元是否具有结构相似的相邻的 信息单元,若该信息单元位于第一网页信息后1/5位置内,且具有结构相似的信息单元,则 判断该信息单元为广告单元,若该信息单元位于第一网页信息1/3-2/3的中间位置内,且 该信息单元没有与其结构相似的相邻的信息单元,则判断该信息单元不是广告单元等。
需要进一步说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发 明所做的限制,本领域技术人员应该理解,任何通过分析要素来确定信息单元类别的方法, 均应包含在本发明的范围内。
接着,在步骤S5中,网络设备2基于第一预定规则,结合所述各个信息单元的类 别,来将所述第一网页信息转换为用于提供给所述用户设备的第二网页信息。
具体地,网络设备2根据第一预定规则中所记录的信息单元的类别与可执行操作 之间的对应关系,来执行相应操作,以将所述第一网页信息转换为第二网页信息。
例如,第一预定规则中设定对于ess单元,当其位于第一网页信息的起始位置时, 不对其进行操作;当其位于第一网页信息的其他位置时,将其移至第一网页信息的起始位 置。则当网络设备2检测到信息单元的类别为ess单元时,根据第一预定规则中的规则,结 合CSS单元的当前位置,确定是否执行将CSS单元移动至起始位置的操作。由于CSS单元 影响网页的结构,而浏览器在生成网页的过程中通常是按照第一网页信息的内容从头至尾 生成,因此,通过将CSS单元前置,能够避免浏览器在生成一部分网页后,由于检测到CSS单 元,因此需要重新生成网页的问题,加快了浏览器生成网页的速度。
需要说明的是,根据信息单元的类别来调整信息单元位置的方式,不以上述举例 为限,本领域技术人员应该理解,只要是根据信息单元的类别,将影响网页结构的信息单元 前置的方案,均应包含在本发明的范围内。
又例如,第一预定规则中设定,删除注释单元,则当网络设备2检测到信息单元的 类别为注释单元时,将注释单元删除。由于注释不影响网页生成,因此,将注释删除,能够减 少浏览器加载网页内容的时间,也减少了用户需要下载的流量,加快了网页呈现的速度。
需要说明的是,根据信息单元的类别来删除信息单元的方式,不以上述举例为限, 本领域技术人员应该理解,只要是根据信息单元的类别,删除不影响网页生成的信息单元 的方案,均应包含在本发明的范围内。
当网络设备2完成对第一网页信息的所有处理后,将该处理后的第一网页信息作 为第二网页信息。
需要进一步说明的是,根据第一预定规则,结合信息单元类别,来将所述第一网页信息转换为用于提供给所述用户设备的第二网页信息的处理方法,并不以上述举例为限, 例如,处理方法还可包括屏蔽垃圾信息单元、凸显正文单元和标题单元等等。
需要更进一步说明的是,步骤S4与步骤S5之间并无先后顺序,网络设备2可在每 判断一个信息单元类别后,即执行相应的操作,也可判断所有信息单元的类别后,再执行相 应的操作。
在步骤S6中,网络设备2将第二网页信息发送给用户设备1。
在步骤S7中,用户设备1根据第二网页信息,生成网页以呈现给用户。
请参阅图2及图3,作为本发明的一个优选实施例,网络设备2可进一步包括web 设备及优化设备。
本实施例中,步骤Sl已在参照图1及图3所示的实施例中详述,并以引用的方式 包含于此,不再赘述。
在步骤S2中,用户设备1将第一请求发送至web设备。其发送方式与以上参照图 1及图3所述实施例中的相应步骤S2相同或相似,并以引用的方式包含于此,不再赘述。
在步骤S3中,web设备根据第一请求获取第一网页信息。其获取方式与参照图1 及图3所述实施例中的相应步骤S3相同或相似,并以引用的方式包含于此,在此不再赘述。
随后,web设备将第一网页信息发送给优化设备,优化设备获取该待处理的第一网 页信息。
接着,优化设备执行前述参照图1及图3所示的实施例中的步骤S4及步骤S5,将 第一网页信息处理为第二网页信息。
接着,优化设备将第二网页信息发送给web设备,web设备再执行步骤S6,将第二 网页信息提供给用户设备1。
最后,用户设备1执行步骤S7,根据第二网页信息,生成网页以呈现给用户。
图4为本发明一个优选实施例的用于优化网页的方法的流程图。本实施例中。本 实施例中,步骤S4可由网络设备2或包含于网络设备2中的优化设备完成,其中,步骤S4 进一步包括步骤S41及步骤S42。
步骤Sl至步骤S3已在参照图1及图3或图2及图3所示的实施例中予以详述, 并以引用的方式包含于此,不再赘述。
在步骤S41中,网络设备2根据所述第一网页信息的链接地址在模板库中进行匹 配查询,以获取相应的类别识别模板。
具体地,模板库中包含了各个类别识别模板及与该各个类别识别模板对应的链接 地址,网络设备2将第一网页信息的链接地址与模板库中的链接地址进行匹配,得到能够 成功匹配的类别识别模板。其中,当网络设备2能够成功匹配到多个链接地址时,选择匹配 度最高的链接地址所对应的类别识别模板。
其中,匹配度可根据两条链接地址的表现形式之间的相似程度来计算,该表现形 式包括但不限于基于http,https,ftp, tencent协议的URL地址或IP地址,MAC地址等。例 如,第一网页信息的链接地址表现为如下URL地址;http://news. sina. com, cn/society, 网络设备2在模板库中成功匹配到多个链接
www, sina. com, cn ;
http://finance, sina. com, cn/stock/ ;
http://mobile, sina. com, cn/ ;
http://news, sina. com, cn/s/sd/ ;及
http: //news, sina. com, cn/society ;
其中,根据字符串相似度可以确定与第一网页信息的链接地址表现形式匹配度最 高的链接为http://news, sina. com, cn/society,该链接对应“类别识别模板一”,则网络设 备2选择“类别识别模板一”作为与第一网页信息相对应的类别识别模板。
在步骤S42中,网络设备2根据第一网页信息所包含的各个信息单元,并结合所述 类别识别模板,来确定所述各个信息单元所属的类别。
具体地,在结合前述实施例中第一预定规则所参考因素的基础上,网络设备2进 一步根据类别识别模板所提供的信息,来对信息单元进行针对性更强的识别操作,以下将 结合前述参考因素,予以详述
1)所述信息单元的标识符;
网络设备2结合类别识别模板中记录的标识符所表示的含义,来判断信息单元所 属的类别。
例如,“类别识别模板一”中记录,标识符“ [ad] ”表示广告,则网络设备2判断标识 符为“ [ad],,的信息单元为广告单元。
2)所述信息单元的文本内容;
网络设备2结合类别识别模板中记录的文本内容的相关信息,判断信息单元所属 的类别。
例如,“类别识别模板一”中记录,当一个信息单元所包含的文本字数超过一预设 阈值时,该信息单元为重要信息单元,则网络设备2判该信息单元为突显单元。
3)所述信息单元在所述第一网页信息中的位置;
网络设备2结合类别识别模板中记录的信息单元的位置与其所属类别的对应关 系,来判断信息单元所属的类别。
例如,“类别识别模板一”中记录,位于第一网页信息后1/3位置内的内容为广告信 息,则网络设备2判断位于第一网页信息后1/3位置内的信息单元为广告单元。
4)与所述信息单元相关的信息单元的信息;
例如,“类别识别模板一”中记录,当存在超过4个结构相似且位置相近的信息单元 时,该信息单元为用于内容推荐的信息单元,则网络设备2判断该类信息单元为推荐单元。
需要说明的是,网络设备2在判断信息单元的类别的过程中,可综合上述因素进 行判断,例如,“类别识别模板一”中记录,当存在超过4个结构相似且位置相近的信息单元 时,需进一步根据信息单元所处的位置进行判断,若信息单元所处的位置为第一网页信息 中靠前1/2至3/4的位置内,则该信息单元为推荐单元;若信息单元所处的位置为第一网页 信息中靠后1/5的位置内,则该信息单元为广告单元等。
需要进一步说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发 明所做的限制,本领域技术人员应该理解,任何通过结合类别识别模板及要素分析来确定 信息单元的类别的方法,均应包含在本发明的范围内。
步骤S5至步骤S7已在参照图1及图3所示的实施例中予以详述,在此以引用的 方式包含,不再赘述。
优选地,本实施例还包括根据用户经由所述用户设备发送的反馈信息和/或所述 第二网页信息,来确定待更新或待建立的类别识别模板的步骤。
具体地,当用户设备1将基于第二网页信息生成的网页呈现给用户后,用户可再 次通过人机交互,经由用户设备1向网络设备2发送反馈信息,该反馈信息包括用户对于网 页优化的满意度。网络设备2记录用户的反馈信息,并选择用户评价值低于一预定阈值的 第二网页信息所采用的类别识别模板,以作为待更新的类别识别模板;或者,若该第二网页 信息未采用类别识别模板,则网络设备2记录该第二网页信息的链接地址,以确定在模板 库中建立与该链接地址相对应的类别识别模板。
图5为根据本发明另一优选实施例的用于优化网页的方法的流程图。本实施例 中,步骤S4进一步包括步骤S4’,步骤S4’可由网络设备2或包含于网络设备2中的优化设 备完成。
步骤Sl至步骤S3已在参照图1及图3或图2及图3所示的实施例中予以详述, 并以引用的方式包含于此,不再赘述。
在步骤S4,中,网络设备2通过结合用户相关信息对所述第一网页信息所包含的 各个信息单元进行分析,以确定所述各个信息单元所属的类别。其中,网络设备2通过识别 用户身份,来获取该用户的用户相关信息,网络设备2可根据以下方式识别用户身份1)用 户设备1的唯一识别码,例如,手机号、用户设备的硬件识别码等;2)用户的注册信息;3) 记录在用户设备cookie中的信息等。用户相关信息可保存在网络设备2中,或者,用户相 关信息保存在用户设备1中,并由网络设备2获取,或者,网络设备2综合保存在用户设备 1及网络设备2中的信息,得到用户相关信息。
其中,所述用户相关信息可由用户主动提供,或网络设备根据记录的用户行为推 测得到。网络设备2可结合以下至少一项用户相关信息,来分析信息单元的类别
1)用户的个人属性,包括用户的年龄、性别、身份、收入、教育程度等;
2)用户的偏好设置,包括屏蔽网页内容的偏好设置,突显网页内容的偏好设置 等;
3)用户的历史行为,包括用户浏览、点击网页的行为记录等;
4)用户的环境信息,包括用户所在的位置信息、用户当前的时间信息及用户设备 相关信息等,其中,用户设备相关信息包括但不限于网络运营商、用户设备类型,IMEI,用 户设备操作系统信息、屏幕分辨率、软件信息等。
例如,当用户相关信息包含该用户为女性,则网络设备2判断包含“服装”、“购物” 等词汇的信息单元为突显单元。
又例如,当用户在偏好设置中设置突显标题,则网络设备2将检测到的标题单元 判断为突显单元。
又例如,当在一预设时间长度内所记录的用户行为仅包括该用户通过新浪网的新 闻页面主页点击打开网页的行为,而无该用户进一步在打开的网页上进行点击的行为,则 网络设备2可基于所记录的用户行为判断该用户仅浏览网页中的正文,故可将正文以外的 其他信息单元确定为可忽略单元。
再例如,网络设备2根据用户设备1当前的IP地址,判断用户所在位置为上海,则 当信息单元的文本内容中包括“上海”时,网络设备2可确定该信息单元为突显单元。
步骤S5至步骤S7已在参照图1及图3所示的实施例中予以详述,以引用的方式 包含于此,不再赘述。
需要说明的是,在步骤S4’中,还可进一步包括前述步骤S41及S42,以结合类别识 别模板及用户相关信息,来确定信息单元所属的类别。
需要进一步说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的 限制,本领域技术人员应该理解,根据任何其他的用户相关信息以及基于用户相关信息来 判断信息单元所属类别的任何其他方式,均应包含在本发明的范围内。
图6为本发明再一个优选实施例的用于优化网页的方法的流程图。本实施例中, 步骤S5进一步包括步骤S5’,步骤S5’可由网络设备2或包含于网络设备2中的优化设备 完成。
步骤Sl至步骤S4已在参照图1和图3、图2和图3、图4或图5所示的实施例中 予以详述,并以引用的方式包含于此,不再赘述。
在步骤S5’中,网络设备2根据所述第一预定规则,并基于所述各个信息单元的类 别,来对所述各个信息单元执行相应的操作,以将所述第一网页信息转换为第二网页信息。
其中,所述第一预定规则包括参考以下至少一项因素来确定所述相应的操作
1)预设的所述类别与可执行操作之间的对应关系;
具体地,在第一预定规则中,规定了每一种信息单元类别所对应的可执行操作,网 络设备2根据信息单元类别与可执行操作之间的对应关系,来对各个信息单元执行相应的 操作,当所有操作完成后,则将处理后的第一网页信息作为第二网页信息。
例如,第一预定规则规定了注释单元及广告单元所对应的可执行操作为删除操 作,则当网络设备2检测到注释单元,将该注释单元删除;
又例如,第一预定规则规定了当ess单元未处于网页信息的起始位置时,将其置 于起始位置,则当网络设备2检测到ess单元时,检测ess单元所处的位置,当其位置不为 起始位置时,将其移至起始位置;
又例如,第一预定规则规定了以红色字体来对突显单元中的文本内容进行突显, 则当网络设备2检测到突显单元时,将突显单元的文本内容的色彩格式更改为红色;
再例如,第一预定规则规定了标记可忽略单元,则当网络设备2检测到可忽略单 元时,对可忽略单元进行标记,以供用户设备1识别可忽略单元,则用户设备1可根据用户 的选择,将所述可忽略单元生成在网页中,呈现给用户;或者,屏蔽该可忽略单元,不将其呈 现给用户。
2)用户相关信息;
具体地,第一预定规则中包含根据用户相关信息及信息单元的类别,来对信息单 元执行相应操作的规则。
例如,若用户在用户偏好设置中规定以灰色背景的方式,对突显单元进行突显,则 网络设备2将突显单元的背景更改为灰色;
又例如,若用户在超过一预定次数中,从未选择呈现可忽略单元,则网络设备2将 可忽略单元的透明度调整为59%,以对可忽略单元进行淡化处理。
需要说明的是,网络设备2还可根据第一预定规则,结合上述两者,来将第一网页 信息转换为第二网页信息。例如,第一预定规则中规定,可屏蔽单元所对应的可执行操作包括标记、删除及淡化,需要结合用户相关信息来选择一项操作,则当检测到可屏蔽单元时, 网络设备2根据用户相关信息,来选择屏蔽、删除或者淡化操作。
需要进一步说明的是,上述举例仅为更好地说明本发明的内容,而非对本发明的 限制,本领域技术人员应该理解,根据第一预定规则来对所述各个信息单元执行相应的操 作,以将所述第一网页信息转换为第二网页信息的方案,均应包含在本发明的范围内。
图7为本发明一个方面的用于优化网页的网络设备结构图。本实施例中,网络设 备2包括获取装置21、类别分析装置22及转换装置23。
用户通过任何一种可与用户设备1进行人机交互的交互设备来输入第一请求,其 中,该第一请求用于为用户设备1请求处理待处理的第一网页信息,例如,用于为用户设备 1请求用户希望浏览的网页信息,或者,用于为用户设备1请求已存储在用户设备1上但 需要优化的网页信息等。其中,该交互设备可以是键盘、鼠标、遥控器、触摸板或声控设备 等,用户可以通过执行预设的操作方式告知用户设备1发送所述请求。例如,以触摸板式人 机交互设备为例,用户通过触控触摸板,选择用户设备1所显示的某个网页链接,再例如, 用户1通过在触摸板上以预设的轨迹滑动,以打开与该预设的轨迹相应的网页,例如,主页 等。当然,本领域技术人员应该理解,上述交互设备仅仅只是举例,而非用于限制本发明,事 实上,其他可供用户用于输入请求的交互设备或方式也均适用于本发明,并以引用方式包 含于此,而不做赘述。
所述用户设备1将所述用户输入的第一请求发送至所述网络设备2。其中,用户 设备1和网络设备2之间的信息收发通过网络进行,该网络包括但不限于1)有线网络;2) 无线网络;3)局域网;4)广域网;5)VPN网络;6)无线自组织网络(Ad Hoc网络)等。
获取装置21获取待处理的第一网页信息。获取装置21获取待处理的第一网页信 息的方式包括多种
1)获取装置21包括第一子获取装置(图未示)及第二子获取装置(图未示)。当 用户设备1发送的第一请求中包括第一网页信息的全部内容,则第一子获取装置获取该第 一请求后,第二子获取装置从该第一请求中直接提取第一网页信息;
2)获取装置21包括第一子获取装置(图未示)及第二子获取装置(图未示),且 第二子获取装置还进一步包括提取装置(图未示)及第三子获取装置(图未示)。当用户 设备1发送的第一请求中仅包括第一网页信息的链接地址,则第一子获取装置获取该第一 请求后,提取装置从所述第一请求中提取所述待处理的第一网页信息的链接地址,第三子 获取装置再根据所述链接地址,从相应的网站中获取所述待处理的第一网页信息。
类别分析装置22分析所述第一网页信息所包含的各个信息单元,以确定所述各 个信息单元所属的类别。
具体地,类别分析装置22对所述第一网页信息进行分析,识别出第一网页信息中 需要处理的信息单元,并通过分析与信息单元相关的因素,来确定各个信息单元所属的类 别。
其中,类别分析装置22可根据以下至少一项因素来确定所述信息单元的类别
1)所述信息单元的标识符;
具体地,类别分析装置22根据第一网页信息中所包含的标识符,来区分信息单 元,并判断信息单元所属的类别。
例如,若类别分析装置22检测到标识符“〈title〉”,则判断两个标识符“〈title〉” 之间的内容为一个信息单元,该信息单元为标题;又例如,若类别分析装置22检测到标识 符“ /*,,或者“ // ”,则判断“ /*,,或者“ // ”至“;”之间的内容为一个信息单元,该信息单元为注释单元等。
2)所述信息单元的文本内容;
具体地,类别分析装置22根据第一网页信息中所包含的标识符,来区分信息单 元,随后,根据该信息单元的文本内容,来判断信息单元所属的类别。
例如,类别分析装置22将信息单元中的文本内容与预设的广告词库中包含的广 告词匹配,若匹配成功,例如匹配得到“欢迎选购”等,则判断该信息单元为广告单元。
3)所述信息单元在所述第一网页信息中的位置;
具体地,类别分析装置22根据第一网页信息中所包含的标识符,来区分信息单 元,随后,类别分析装置22通过该信息单元在第一网页信息中的位置,来判断信息单元所 属的类别;
例如,类别分析装置22分析得到超过一定数量的,结构相近的信息单元位于第一 网页信息后1/5位置内,则判断该信息单元为广告单元。
4)与所述单元相关的信息单元的信息;
具体地,类别分析装置22根据第一网页信息中所包含的标识符,来区分信息单 元,随后,类别分析装置22通过查找与该信息单元具有相同标识符的信息单元的类别或查 找与该信息单元位置相近且结构相似的信息单元的类别或包含的内容,来判断该信息单元 所属的类别。其中,所述结构相似是指两个信息单元中相同的部分超过一预定比例阈值,例 如,超过50%等。在此,本领域技术人员应可根据实际需求来确定一个合理的预定阈值。
例如,类别分析装置22在判断一信息单元时,首先查找到其前一信息单元;随后, 将其与待判断的信息单元进行对比,当两者标识符相同,且两者的文本匹配度高于一预定 阈值,则判断该信息单元的类别与前一信息单元的类别相同。
需要说明的是,类别分析装置22在判断信息单元的类别的过程中,可综合上述因 素进行判断,例如,当类别分析装置22检索到信息单元的文本内容与广告词库中的广告词 相匹配,则再进一步判断该信息单元在第一网页中的位置及该信息单元是否具有结构相似 的相邻的信息单元,若该信息单元位于第一网页信息后1/5位置内,且具有结构相似的信 息单元,则判断该信息单元为广告单元,若该信息单元位于第一网页信息1/3-2/3的中间 位置内,且该信息单元没有与其结构相似的相邻的信息单元,则判断该信息单元不是广告 单元等。
需要进一步说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发 明所做的限制,本领域技术人员应该理解,任何通过分析要素来确定信息单元的类别的方 法,均应包含在本发明的范围内。
转换装置23基于第一预定规则,结合所述各个信息单元的类别,来将所述第一网 页信息转换为用于提供给所述用户设备的第二网页信息。
具体地,转换装置23根据第一预定规则中所记录的信息单元的类别与可执行操 作之间的对应关系,来执行相应操作,以将所述第一网页信息转换为第二网页信息。
例如,第一预定规则中设定对于ess单元,当其位于第一网页信息的起始位置时,不对其进行操作;当其位于第一网页信息的其他位置时,将其移至第一网页信息的起始位 置。则当类别分析装置22判断得到信息单元的类别为ess单元时,根据第一预定规则中的 规则,结合ess单元的当前位置,确定是否执行将ess单元移动至起始位置的操作。由于CSS 单元影响网页的结构,而浏览器在生成网页的过程中通常是按照第一网页信息的内容从头 至尾生成,因此,通过将ess单元前置,能够避免浏览器在生成一部分网页后,由于检测到 ess单元,因此需要重新生成网页的问题,加快了浏览器生成网页的速度。
需要说明的是,根据信息单元的类别来调整信息单元位置的方式,不以上述举例 为限,本领域技术人员应该理解,只要是根据信息单元的类别,将影响网页结构的信息单元 前置的方案,均应包含在本发明的范围内。
又例如,第一预定规则中设定,删除注释单元,则当类别分析装置22判断得到信 息单元的类别为注释单元时,将注释单元删除。由于注释不影响网页生成,因此,将注释删 除,能够减少浏览器加载网页内容的时间,也减少了用户需要下载的流量,加快了网页呈现 的速度。
需要说明的是,根据信息单元的类别来删除信息单元的方式,不以上述举例为限, 本领域技术人员应该理解,只要是根据信息单元的类别,删除不影响网页生成的信息单元 的方案,均应包含在本发明的范围内。
当转换装置23完成对第一网页信息的所有处理后,将处理后的第一网页信息作 为第二网页信息。
需要进一步说明的是,根据第一预定规则,结合信息单元类别,来将所述第一网页 信息转换为用于提供给所述用户设备的第二网页信息的处理方法,并不以上述举例为限, 例如,处理方法还可包括屏蔽垃圾信息单元、凸显正文单元和标题单元等等。
需要更进一步说明的是,类别分析装置22与转换装置23各自所执行的操作并无 绝对的先后顺序,类别分析装置22在每判断一个信息单元类别后,转换装置23即可执行相 应的操作,也可当类别分析装置22判断所有信息单元的类别后,转换装置23再执行相应的 操作。
网络设备2将转换装置23生成的第二网页信息发送给用户设备1,用户设备1根 据第二网页信息,生成网页以呈现给用户。
作为本发明的一个优选实施例,网络设备2可进一步包括web设备及优化设备。则 获取装置22包含在web设备中,类别分析装置22及转换装置23包含在优化设备中。
用户设备1将第一请求发送至web设备。其发送方式已在参照图7所示的实施例 中详述,并以引用的方式包含于此,不再赘述。获取装置22根据第一请求获取第一网页信 息。其获取方式已在与参照图7所示的实施例中详述,并以引用的方式包含于此,不再赘 述。
随后,web设备将第一网页信息发送给优化设备,优化设备获取该待处理的第一网页信息。
接着,类别分析装置22及转换装置23将第一网页信息处理为第二网页信息。类 别分析装置22及转换装置23将第一网页信息处理为第二网页信息的方式已在参照图7所 示的实施例中详述,并以引用的方式包含于此,不再赘述。
接着,优化设备将第二网页信息发送给web设备,web设备再将第二网页信息提供给用户设备1,用户设备1根据第二网页信息,生成网页以呈现给用户。
图8为本发明一个优选实施例的用于优化网页的网络设备结构图。本实施例中, 类别分析装置22可包含于网络设备2或包含于网络设备2的优化设备中,其中,类别分析 装置22还进一步包括匹配查询装置221及确定装置222。
获取装置21及转换装置23已在参照图7所示的实施例中予以详述,并以引用的 方式包含于此,不再赘述。
匹配查询装置221根据所述第一网页信息的链接地址在模板库M中进行匹配查 询,以获取相应的类别识别模板。
具体地,模板库M中包含了各个类别识别模板及与该各个类别识别模板对应的 链接地址,匹配查询装置221将第一网页信息的链接地址与模板库中的链接地址进行匹 配,得到能够成功匹配的类别识别模板。其中,当匹配查询装置221能够成功匹配到多个链 接地址时,选择匹配度最高的链接地址所对应的类别识别模板。
其中,匹配度可根据两条链接地址的表现形式之间的相似程度来计算,该表现形 式包括但不限于基于http,https,ftp, tencent协议的URL地址或IP地址,MAC地址等。 例如,第一网页信息的链接地址表现为如下URL地址http://news, sina. com, cn/society, 匹配查询装置221在模板库M中成功匹配到多个链接
www, sina. com, cn ;
http/,/finance· sina. com. cn/stock/
http/,/mobile, sina. com. cn/ ;
http/Vnews. sina. com. cn/s/sd/ ;及
http/Vnews. sina. com. cn/society ;
其中,根据字符串相似度可以确定与第一网页信息的链接地址表现形式匹配度最 高的链接为http://news, sina. com, cn/society,该链接对应“类别识别模板一”,则匹配查 询装置221选择“类别识别模板一”作为与第一网页信息相对应的类别识别模板。
确定装置222根据第一网页信息所包含的各个信息单元,并结合所述类别识别模 板,来确定所述各个信息单元所属的类别。
具体地,在结合前述实施例中第一预定规则所参考因素的基础上,确定装置222 进一步根据类别识别模板所提供的信息,来信息单元进行针对性更强的识别操作,以下将 结合前述参考因素,予以详述
1)所述信息单元的标识符;
确定装置222结合类别识别模板中记录的标识符所表示的含义,来判断信息单元 所属的类别。
例如,“类别识别模板一”中记录,标识符“ [ad] ”表示广告,则确定装置222判断标 识符为“ [ad],,的信息单元为广告单元。
2)所述信息单元的文本内容;
确定装置222结合类别识别模板中记录的文本内容的相关信息,判断信息单元所 属的类别。
例如,“类别识别模板一”中记录,当一个信息单元所包含的文本字数超过一预设 阈值时,该信息单元为重要信息单元,则确定装置222判该信息单元为突显单元。
3)所述信息单元在所述第一网页信息中的位置;
确定装置222结合类别识别模板中记录的信息单元的位置与其所属类别的对应 关系,来判断信息单元所属的类别。
例如,“类别识别模板一”中记录,位于第一网页信息后1/3位置内的内容为广告信 息,则确定装置222判断位于第一网页信息后1/3位置内的信息单元为广告单元。
4)与所述信息单元相关的信息单元的信息;
例如,“类别识别模板一”中记录,当存在超过4个结构相似且位置相近的信息单元 时,该信息单元为用于内容推荐的信息单元,则确定装置222判断该类信息单元为推荐单兀。
需要说明的是,确定装置222在判断信息单元的类别的过程中,可综合上述因素 进行判断,例如,“类别识别模板一”中记录,当存在超过4个结构相似且位置相近的信息单 元时,需进一步根据信息单元所处的位置进行判断,若信息单元所处的位置为第一网页信 息中靠前1/2至3/4的位置内,则该信息单元为推荐单元;若信息单元所处的位置为第一网 页信息中靠后1/5的位置内,则该信息单元为广告单元等。
需要进一步说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发 明所做的限制,本领域技术人员应该理解,任何通过结合类别识别模板及要素分析来确定 信息单元的类别的方法,均应包含在本发明的范围内。
优选地,本实施例还包括更新装置(图未示),更新装置用于根据用户经由所述 用户设备发送的反馈信息和/或所述第二网页信息,来确定待更新或待建立的类别识别模 板。
具体地,当用户设备1将基于第二网页信息生成的网页呈现给用户后,用户可再 次通过人机交互,经由用户设备1向网络设备2发送反馈信息,该反馈信息包括用户对于网 页优化的满意度,更新装置记录用户的反馈信息,并选择用户评价值低于一预定阈值的第 二网页信息所采用的类别识别模板,以作为待更新的类别识别模板;或者,若该第二网页信 息未采用类别识别模板,则更新装置记录该第二网页信息的链接地址,以确定在模板库中 建立与该链接地址相对应的类别识别模板。
图9为根据本发明另一优选实施例的用于优化网页的网络设备结构图。本实施例 中,类别分析装置22可包含于网络设备2或包含于网络设备2的优化设备中,其中,类别分 析装置22还进一步包括子类别分析装置223。
获取装置21及转换装置23已在参照图7所示的实施例中予以详述,并以引用的 方式包含于此,不再赘述。
子类别分析装置223通过结合用户相关信息对对所述第一网页信息所包含的各 个信息单元进行分析,以确定所述各个信息单元所属的类别。其中,网络设备2通过识别用 户身份,来获取该用户的用户相关信息,网络设备2可根据以下方式识别用户身份1)用户 设备1的唯一识别码,例如,手机号、用户设备的硬件识别码等;2)用户的注册信息;3)记 录在用户设备cookie中的信息等。用户相关信息可保存在网络设备2中,或者,用户相关 信息保存在用户设备1中,并由网络设备2获取,或者,网络设备2综合保存在用户设备1 及网络设备2中的信息,得到用户相关信息。
其中,所述用户相关信息可由用户主动提供,或网络设备根据记录的用户行为推测得到。子类别分析装置223可结合以下至少一项用户相关信息,来分析信息单元的类别
1)用户的个人属性,包括用户的年龄、性别、身份、收入、教育程度等;
2)用户的偏好设置,包括屏蔽网页内容的偏好设置,突显网页内容的偏好设置 等;
3)用户的历史行为,包括用户浏览、点击网页的行为记录等;
4)用户的环境信息,包括用户所在的位置信息、用户当前的时间信息及用户设备 相关信息等,其中,用户设备相关信息包括但不限于网络运营商、用户设备类型,IMEI,用 户设备操作系统信息、屏幕分辨率、软件信息等。
例如,当用户相关信息包含该用户为女性,则子类别分析装置223判断包含“服 装”、“购物”等词汇的信息单元为突显单元。
又例如,当用户在偏好设置中设置突显标题,则子类别分析装置223将检测到的 标题单元判断为突显单元。
又例如,当用户在一预设的时间长度内所记录的用户行为仅包括该用户通过新网 的新闻页面主页点击打开网页的行为,而无该用户进一步在打开的网页上进行点击的行 为,则子类别分析装置223可基于所记录的用户行为判断该用户仅浏览网页中的正文,故 可将正文以外的其他信息单元确定为可忽略单元。
再例如,子类别分析装置223根据用户设备1当前的IP地址,判断用户所在位置 为上海,则当信息单元的文本内容中包括“上海”时,子类别分析装置223可确定该信息单 元为突显单元。
需要说明的是,子类别分析装置223也可进一步包含匹配查询装置221及确定装 置222,以结合类别识别模板及用户相关信息,来确定信息单元所属的类别。
需要进一步说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的 限制,本领域技术人员应该理解,根据任何其他的用户相关信息以及基于用户相关信息来 判断信息单元所属类别的任何其他方式,均应包含在本发明的范围内。
图10为本发明再一个优选实施例的用于优化网页的网络设备结构图。本实施例 中,转换装置23可包含于网络设备2或包含于网络设备2的优化设备中,其中,转换装置23 还进一步包括子转换装置231。
获取装置21及类别分析装置22已在参照图7、图8或图9所示的实施例中予以详 述,并以引用的方式包含于此,不再赘述。
子转换装置231根据所述第一预定规则,并基于所述各个信息单元的类别,来对 所述各个信息单元执行相应的操作,以将所述第一网页信息转换为第二网页信息。
其中,所述第一预定规则包括参考以下至少一项因素来确定所述相应的操作
1)预设的所述类别与可执行操作之间的对应关系;
具体地,在第一预定规则中,规定了每一种信息单元类别所对应的可执行操作,子 转换装置231根据信息单元类别与可执行操作之间的对应关系,来对各个信息单元执行相 应的操作,当所有操作完成后,则将处理后的第一网页信息作为第二网页信息。
例如,第一预定规则规定了注释单元及广告单元所对应的可执行操作为删除操 作,则当子转换装置231检测到注释单元,将该注释单元删除;
又例如,第一预定规则规定了当ess单元未处于网页信息的起始位置时,将其置18于起始位置,则当子转换装置231检测到ess单元时,检测ess单元所处的位置,当其位置 不为起始位置时,将其移至起始位置;
又例如,第一预定规则规定了以红色字体来对突显单元中的文本内容进行突显, 则当子转换装置231检测到突显单元时,将突显单元的文本内容的色彩格式更改为红色;
再例如,第一预定规则规定了标记可忽略单元,则当子转换装置231检测到可忽 略单元时,对可忽略单元进行标记,以供用户设备1识别可忽略单元,则用户设备1可根据 用户的选择,将所述可忽略单元生成在网页中,呈现给用户;或者,屏蔽该可忽略单元,不将 其呈现给用户。
2)用户相关信息;
具体地,第一预定规则中包含根据用户相关信息及信息单元的类别,来对信息单 元执行相应操作的规则。
例如,若用户在用户偏好设置中规定以灰色背景的方式,对突显单元进行突显,则 子转换装置231将突显单元的背景更改为灰色;
又例如,若用户在超过一预定次数中,从未选择呈现可忽略单元,则子转换装置 231将可忽略单元的透明度调整为59%,以对可忽略单元进行淡化处理。
需要说明的是,子转换装置231还可根据第一预定规则,结合上述两者,来将第一 网页信息转换为第二网页信息。例如,第一预定规则中规定,可屏蔽单元所对应的可执行操 作包括标记删除及淡化,需要结合用户相关信息来选择一项操作,则当检测到可屏蔽单元 时,子转换装置231根据用户相关信息,来选择屏蔽、删除或者淡化操作。
需要进一步说明的是,上述举例仅为更好地说明本发明的内容,而非对本发明的 限制,本领域技术人员应该理解,根据第一预定规则来对所述各个信息单元执行相应的操 作,以将所述第一网页信息转换为第二网页信息的方案,均应包含在本发明的范围内。
本发明中的各预定阈值,均可由本领域技术人员根据实际需求来确定。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在 不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此 外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多 个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来 表示名称,而并不表示任何特定的顺序。
权利要求
1.一种在网络设备中用于优化网页的方法,其中,该方法包括以下步骤 a获取待处理的第一网页信息;b分析所述第一网页信息所包含的各个信息单元,以确定所述各个信息单元所属的类别;c基于第一预定规则,结合所述各个信息单元的类别,来将所述第一网页信息转换为用 于提供给所述用户设备的第二网页信息。
2.根据权利要求1所述的方法,其中,所述步骤b中根据以下至少一项因素,来确定所 述信息单元的类别-所述信息单元的标识符; -所述信息单元的文本内容; -所述信息单元在所述第一网页信息中的位置; -与所述信息单元相关的信息单元的信息。
3.根据权利要求1或2所述的方法,其中,所述步骤b包括以下步骤-根据所述第一网页信息的链接地址在模板库中进行匹配查询,以获取相应的类别识 别模板;-根据第一网页信息所包含的各个信息单元,并结合所述类别识别模板,来确定所述各 个信息单元所属的类别。
4.根据权利要求3所述的方法,其中,该方法还包括以下步骤-根据用户经由所述用户设备发送的反馈信息和/或所述第二网页信息,来确定待更 新或待建立的类别识别模板。
5.根据权利要求1至4中任一项所述的方法,其中,所述步骤b还包括以下步骤-分析所述第一网页信息所包含的各个信息单元,结合用户相关信息,以确定所述各个 信息单元所属的类别。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤c包括以下步骤-基于所述第一预定规则,结合所述各个信息单元的类别,来对所述各个信息单元执行 相应的操作,以将所述第一网页信息转换为第二网页信息。
7.根据权利要求1至6中任一项所述的方法,其中,所述第一预定规则包括参考以下至 少一项因素来确定所述相应的操作-预设的所述类别与可执行操作之间的对应关系; -用户相关信息。
8.根据权利要求5或7所述的方法,其中,所述用户相关信息包括以下至少一项 -用户的个人属性;-用户的偏好设置; -用户的历史行为; -用户的环境信息。
9.根据权利要求1至8中任一项所述的方法,其中,所述步骤a还包括以下步骤-获取来自用户设备的第一请求,该第一请求用于为用户设备请求处理待处理的第一 网页信息;-根据所述第一请求,获取所述待处理的第一网页信息。
10.根据权利要求9所述的方法,其中,所述获取所述待处理的第一网页信息的步骤包 括以下步骤-从所述第一请求中提取所述待处理的第一网页信息的链接地址; -根据所述链接地址,获取所述待处理的第一网页信息。
11.根据权利要求1至10中任一项所述的方法,其中,所述网络设备包括网络主机、 单个网络服务器、多个网络服务器集或基于云计算的计算机集合。
12.一种用于优化网页的网络设备,其中,该网络设备包括 获取装置、用于获取所述待处理的第一网页信息;类别分析装置、用于分析所述第一网页信息所包含的各个信息单元,以确定所述各个 信息单元所属的类别;转换装置、用于基于第一预定规则,结合所述各个信息单元的类别,来将所述第一网页 信息转换为用于提供给所述用户设备的第二网页信息。
13.根据权利要求12所述的网络设备,其中,所述类别分析装置根据以下至少一项因 素,来确定所述信息单元的类别-所述信息单元的标识符; -所述信息单元的文本内容; -所述信息单元在所述第一网页信息中的位置; -与所述信息单元相关的信息单元的信息。
14.根据权利要求12或13所述的网络设备,其中,所述类别分析装置包括匹配查询装置、用于根据所述第一网页信息的链接地址在模板库中进行匹配查询,以 获取相应的类别识别模板;确定装置、用于根据第一网页信息所包含的各个信息单元,并结合所述类别识别模板, 来确定所述各个信息单元所属的类别。
15.根据权利要求14所述的网络设备,其中,该网络设备还包括更新装置、用于根据用户经由所述用户设备发送的反馈信息和/或所述第二网页信 息,来确定待更新或待建立的类别识别模板。
16.根据权利要求12至15中任一项所述的网络设备,其中,所述类别分析装置还包括子类别分析装置、用于分析所述第一网页信息所包含的各个信息单元,结合用户相关 信息,以确定所述各个信息单元所属的类别。
17.根据权利要求12至16中任一项所述的网络设备,其中,所述转换装置包括 子转换装置、用于基于所述第一预定规则,结合所述各个信息单元的类别,来对所述各个信息单元执行相应的操作,以将所述第一网页信息转换为第二网页信息。
18.根据权利要求12至17中任一项所述的网络设备,其中,所述第一预定规则包括参 考以下至少一项因素来确定所述相应的操作-预设的所述类别与可执行操作之间的对应关系; -用户相关信息。
19.根据权利要求16或18所述的网络设备,其中,所述用户相关信息包括以下至少一项-用户的个人属性; -用户的偏好设置; -用户的历史行为; -用户的环境信息。
20.根据权利要求12至19中任一项所述的网络设备,其中,所述获取装置还包括以下 步骤第一子获取装置、用于获取来自用户设备的第一请求,该第一请求用于为用户设备请 求处理待处理的第一网页信息;第二子获取装置、用于根据所述第一请求,获取所述待处理的第一网页信息。
21.根据权利要求20所述的网络设备,其中,所述第二子获取装置包括提取装置、用于从所述第一请求中提取所述待处理的第一网页信息的链接地址; 第三子获取装置、用于根据所述链接地址,获取所述待处理的第一网页信息。
22.根据权利要求12至21中任一项所述的网络设备,其中,该网络设备包括网络主 机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合。
全文摘要
本发明提供一种在网络设备中用于优化网页的方法及设备,本发明中,通过获取待处理的第一网页信息;分析所述第一网页信息所包含的各个信息单元,以确定所述各个信息单元所属的类别;及基于第一预定规则,结合所述各个信息单元的类别,来实现将所述第一网页信息转换为用于提供给所述用户设备的第二网页信息的目的。与现有技术相比,本发明具有以下优点1)能够突显用户关注的内容,减少用户查找的时间;2)能够屏蔽广告内容及用户不关注的内容,带来更好的网页浏览体验;3)能够去除网页中的冗余内容,减少网页的加载时间;4)能够调整网页结构,加快网页的排版速度。
文档编号H04L29/08GK102035883SQ20101056978
公开日2011年4月27日 申请日期2010年11月26日 优先权日2010年11月26日
发明者朱晋良, 邢皖甲 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1