收藏网页的处理方法、收藏网页的处理装置和客户端的制作方法

文档序号:8223515阅读:289来源:国知局
收藏网页的处理方法、收藏网页的处理装置和客户端的制作方法
【技术领域】
[0001]本发明涉及互联网技术领域,特别是涉及一种收藏网页的处理方法、收藏网页的处理装置和客户端。
【背景技术】
[0002]随着计算机和网络技术的不断发展,用于浏览网页的终端类型越来越多样化,传统的使用个人计算机浏览网页所占的比例逐渐降低。
[0003]然而当前网络中的大部分网页仍然按照个人计算机的浏览器的特点和加载界面进行设计,但是由于不同终端的显示界面以及用于浏览网页的浏览器和客户端的种类不同,直接加载这些网页,有可能导致展示的效果不能使用户满意。
[0004]基于以上原因,现有技术中出现了一些网页转码的技术,通过对网页中的图片等进行压缩等处理,有些还对某些网页重新进行了布局,这些网页转码的工作一般由浏览器进行,一方面需要占用终端大量的计算资源,另一方面,处理的效果不佳,经常会出现类似于内容被遮挡、页面风格不匹配等情况。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的收藏网页的处理装置和客户端和相应的收藏网页的处理方法。本发明一个进一步的目的是要使得用户方便地利用各种客户端浏览收藏的页面。
[0006]本发明另一个进一步的目的是要减少终端侧的转码操作。
[0007]依据本发明的一个方面,提供了一种收藏网页的处理方法。该收藏网页的处理方法包括:获取待收藏的目标网页的统一资源定位符;通过网络蜘蛛按照统一资源定位符抓取目标网页中预设元素的内容;将抓取的内容按照元素类型分别填入预设的网页模板,以生成收藏页面,其中每个网页模板按照一种客户端的展示界面预先生成;保存生成的收藏页面。
[0008]可选地,在获取待收藏的目标网页的统一资源定位符之后还包括:对统一资源定位符和/或目标网页的内容进行安全扫描,以确定目标网页的安全性;如果确定目标网页安全,执行抓取目标网页中预设元素的内容的步骤;如果确定目标网页存在安全隐患,输出安全提示信息。
[0009]可选地,获取需要收藏的目标网页的统一资源定位符之后还包括:判断目标网页是否已经过终端适配处理;若否,执行通过网络蜘蛛按照统一资源定位符抓取目标网页中预设元素的内容的步骤。
[0010]可选地,判断目标网页是否已进行终端适配处理包括:分别使用不同浏览器标识访问统一资源定位符,得到多个返回页面;对比接收到的多个返回页面;在多个返回页面相同时,确定目标网页未经过终端适配处理。
[0011]可选地,在目标网页已经过终端适配处理时还包括:将多个返回页面作为收藏页面进行保存。
[0012]可选地,将抓取的内容按照元素类型分别填入预设的网页模板包括:将抓取的内容按照网页模板规定的元素格式进行转码和/或压缩处理;将经过处理的内容按照元素类型分别填入网页模板。
[0013]可选地,在保存生成的收藏页面之后还包括:接收到页面访问请求;提取页面访问请求中的浏览器标识和目标网页信息;查询与目标网页信息匹配的收藏页面;从查询出的收藏页面中挑选出与页面访问请求中的浏览器标识相匹配的收藏页面并下发。
[0014]可选地,在下发收藏页面后还包括:下发展示收藏页面的所需的插件信息和/或与收藏页面内容相匹配的信息,以供用户选择。
[0015]可选地,网页模板为内容管理系统模板,并且内容管理系统模板与其对应的客户端类型对应保存。
[0016]可选地,在获取待收藏的目标网页的统一资源定位符之前还包括:获取用户登录信息以及与用户登录信息绑定的内容管理系统模板。
[0017]可选地,预设元素包括以下任意一项或多项:标题、文档正文、图片、视频、超链接、动画。
[0018]根据本发明的另一个方面,还提供了一种收藏网页的处理装置。收藏网页的处理装置包括:获取模块,配置为获取待收藏的目标网页的统一资源定位符;内容抓取模块,配置为通过网络蜘蛛按照统一资源定位符抓取目标网页中预设元素的内容;页面生成模块,配置为将抓取的内容按照元素类型分别填入预设的网页模板,以生成收藏页面,其中每个网页模板按照一种客户端的展示界面预先生成;页面保存模块,配置为保存收藏页面。
[0019]可选地,上述收藏网页的处理装置还包括:安全扫描模块,配置为对统一资源定位符和/或目标网页的内容进行安全扫描,以确定目标网页的安全性,并在确定目标网页存在安全隐患时,输出安全提示信息;如果确定目标网页安全,内容抓取模块配置为:执行抓取目标网页中预设元素的内容的步骤。
[0020]可选地,上述对收藏网页的处理装置还包括:判断模块,配置为判断目标网页是否已经过终端适配处理;内容抓取模块还配置:在判断模块的判断结果为否时,执行抓取目标网页中预设元素的内容的步骤。
[0021]可选地,判断模块还配置为:分别使用不同浏览器标识访问收藏网页的处理统一资源定位符,得到多个返回页面;对比接收到的多个返回页面;在多个返回页面相同时,确定目标网页未经过终端适配处理。
[0022]可选地,页面保存模块还配置为:在判断模块的判断结果为是时,将多个返回页面作为收藏页面进行保存。
[0023]可选地,页面生成模块还配置为:将抓取的内容按照网页模板规定的元素格式进行转码和/或压缩处理;将经过处理的内容按照元素类型分别填入网页模板。
[0024]可选地,以上收藏网页的处理装置还包括:页面下发模块,配置为:接收到页面访问请求;查询与目标网页信息匹配的多个收藏页面;从查询出的多个收藏页面中挑选出与页面访问请求中的浏览器标识相匹配的收藏页面并下发。
[0025]可选地,以上收藏网页的处理装置还包括:信息匹配模块,配置为:下发展示收藏页面的所需的插件信息和/或与收藏页面内容相匹配的信息,以供用户选择。
[0026]可选地,网页模板为内容管理系统模板,并且内容管理系统模板与其对应的客户端类型对应保存。
[0027]可选地,以上收藏网页的处理装置还包括:模板获取模块,配置为获取用户登录信息以及与收藏网页的处理用户登录信息绑定的内容管理系统模板。
[0028]可选地,预设元素包括以下任意一项或多项:标题、文档正文、图片、视频、超链接、动画。
[0029]根据本发明的另一个反面,还提供了一种收藏网页的处理方法。该收藏网页的处理方法包括:接收用户对目标网页的收藏操作;提取目标网页的统一资源定位符;上传统一资源定位符以及用户登录信息,以便服务器侧按照统一资源定位符抓取目标网页中预设元素的内容,并按照与用户登录信息匹配的网页模板生成收藏页面并保存。
[0030]可选地,在接收用户对目标网页的收藏操作之前还包括:获取用户使用的客户端类型信息并上传,以便服务器侧根据客户端类型信息确定网页模板的类型。
[0031]可选地,在上传收藏网页的处理统一资源定位符以及用户登录信息之后还包括:获取用户浏览收藏网页的浏览操作;按照浏览操作生成并上传页面访问请求,其中页面访问请求中添加有浏览器标识以及收藏网页信息;接收按照页面访问请求返回的收藏页面并加载。
[0032]根据本发明的另一个方面,还提供了一种客户端。该客户端包括:操作接收接口,配置为接收用户对目标网页的收藏操作;信息提取模块,配置为提取目标网页的统一资源定位符;上传接口,配置为上传统一资源定位符以及用户登录信息,以便服务器侧按照统一资源定位符抓取目标网页中预设元素的内容,并按照与用户登录信息匹配的网页模板生成收藏页面并保存。
[0033]可选地,上述客户端还包括:配置获取模块,配置为获取用户使用的客户端类型信息并上传,以便服务器侧根据客户端类型信息确定网页模板的类型。
[0034]可选地,上述客户端还包括:页面加载模块,配置为:获取用户浏览收藏网页的浏览操作,按照浏览操作生成并上传页面访问请求,其中页面访问请求中添加有浏览器标识以及收藏网页信息,接收按照页面访问请求返回的收藏页面并加载。
[0035]本发明的收藏网页的处理方法,使用网络蜘蛛爬取用户需要收藏的页面的内容,并根据爬取的内容使用网页模板生成对应收藏网页并保存,由于采用模板对收藏网页进行了重新的构建,便于与用户使用的客户端进行匹配,避免了用户客户端的展示界面不同导致的使用不便。
[0036]进一步地,本发明的收藏网页的处理方法,根据客户端的展示界面特点设置多个内容管理系统模板,并根据用户所使用的客户端类型,生成并保存对应的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1