网页智能快照系统及其方法

文档序号:7970302阅读:171来源:国知局
专利名称:网页智能快照系统及其方法
技术领域
本发明涉及计算机网络技术,特别是涉及一种互联网服务中用于移动终端的网页 智能快照技术。
背聚拨术当今的互联网(Internet)十分发达,曰前,中国互联网络信息中心(CNNIC)在 北京发布《第十八次中国互联网络发展状况统计报告》。报告表明,我国互联网发展 再次提速,在多个方面呈现出蓬勃发展的势头,进入了又一个快速发展期。截止到 2006年6月30日,我国网民人数达到了 1.23亿人,与去年同期相比增长了 19.4%, 其中宽带上网网民人数为7700万人,在所有网民中的比例接近2/3。我国网站总数 达到了 78.84万个,其中今年上半年增长了 9万个。同时,无线上网也在蓬勃发展 中,2000年5月中国移动正式推出手机WAP (Wireless Application Protocol,无 线应用协议)上网服务,手机上网业务逐步成为继短信之后的第二个"杀手级"移 动增值业务。据艾瑞市场咨询公司统计与分析中国WAP用户数在2003年只有900 万,到2004年用户数增长了四倍多,达到了 4600万户,随着2004年运营商政策 的调整,2005年WAP用户数的增幅将趋缓,用户规模达到7200万户,主要是免费 WAP应用的增多保证了用户增长的速度,预计到2008年中国WAP用户规模将达到 2.3亿户。移动通信技术的发展,尤其是2.5G的成熟和3G的即将上马,使增值业 务在技术基础和传输速率方面有极大改善和提高,将促进移动终端的升级换代和各 种增值业务的出现。而随着无线宽带的普及,各类互联网增值业务也将在移动增值 业务中得到广泛的应用。现在的互联网是针对计算机开发的,个人计算机经过几十
年的快速发展,浏览互联网是成熟的技术,并形成成熟的市场。但手机等手持移动终端由于处理单元不够先进、设备的屏幕小,而且分辨率较之于PC显得太小,因此要让手机连上Internet网络获得资讯,其实无论在技术上还是在市场上都没有达到成熟地步。开发移动设备上网相关技术,无疑会大大促进Internet在移动设备上的应用,带动巨大的市场。网页智能快照技术就是为了促进互联网增值业务在移动增值业务中应用而开发的。 发明内容针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种使互 联网网页通过图像处理适合无线终端(手机)等浏览的网页智能快照系统及其方法。为了解决上述技术问题,本发明所提供的一种网页智能快照系统,包括 一网页切割模块,用于对页面进行合理分类和净化,能过滤互联网的干扰信息 (如广告等);其输入端连接互联网;一网页快照模块,用于把网页拍成快照;其输入端连接所述网页切割模块;一图像处理模块,用于把网页快照压縮后分层、实时传给无线终端用户,其输 入端连接所述网页快照模块;一智能控制模块,用于执行用户指令,控制快照过程;分别连接互联网、网页 切割模块、网页快照模块、图像处理模块和终端用户。为了解决上述技术问题,本发明所提供的一种网页智能快照系统的运行方法, 其步骤包括1) 传入网页,由互联网传入网页;2) 网页切割,对页面进行合理分类和净化,根据关键词进行判断与主题内容 相关的网页传送至3);与主题内容无关的干扰信息(如广告等)传送至回收站;3) 网页快照,把网页拍成快照;4) 图像处理,把网页快照压縮后分层、实时传送给无线终端(手机)用户。
利用本发明提供的网页智能快照系统及其方法,由于采用了网页切割模块、网 页快照模块、图像处理模块、智能控制模块等处理,互联网网页实现轻量化和多模 式化,适合手机等移动终端浏览。轻量化处理是指处理过的网页的大小与原有Internet网页相比,在不改变有效信息的同时有巨大的压縮(可以达到几十倍左右),减少了移动终端浏览时下载量,加快了浏览和下载的速度。多模式化处理是指针对不同型号的移动终端进行不同模式的处理,以使处理过的网页适合目前的多样化的移动终端,臂如,不同型号的手机可能有不同的分辨率要求。另外,本系统的智能快照技术还有缓冲功能,不仅可以加快访问速度,还可以起到一定的应急作用,替如,用户请求访问的Internet网页被删除或连接失效时,可以通过访问本系统缓冲中的网页快照来査看网页内容。


图1是本发明实施例网页智能快照系统的结构示意框图; 图2是本发明网页智能快照系统的运行步骤示意图。
具体实施方式
以下结合

对本发明的实施例作进一步详细描述,但本实施例并不用于 限制本发明,凡是采用本发明的相似结构、方法及其相似变化,均应列入本发明的 保护范围。参见图1所示,本发明实施例所提供的一种网页智能快照系统,包括一网页切割模块,用于对页面进行合理分类和净化,可以过滤互联网的干扰信 息(如广告等);其输入端连接互联网;一网页快照模块,用于把网页拍成快照;其输入端连接所述网页切割模块; 一图像处理模块,用于把网页快照压縮后分层、实时传给无线终端用户,其输入端连接所述网页快照模块;一智能控制模块,用于执行用户指令,控制快照过程;分别连接互联网、网页切割模块、网页快照模块、图像处理模块和终端用户;
本发明的网页智能快照系统的主要功能模块的具体功能如下所示。 页面切割模块商业化网站的页面极为复杂,不仅包括用户需要的各类信息,还包含大量的广告、菜单,图片等信息。页面切割模块利用AI的智能Agent技术建立过滤规则算法, 在保证不损害原始页面的情况下,来对页面进行合理分类和净化。分类是把当前页 面中有用的子链接按内容等分类,以便快照模块建立相应的快照,如体育、新闻等; 净化是当前页面中与主题内容无关的信息在建立快照前过滤掉,如广告等。过滤规 则算法首先判断网页的类别和级别。过滤规则可以根据网络资源URL和关键词建立。 网络资源URL规则是根据具体的网络资源URL判断,例如,新浪的首页是 (http:〃www. sina.com.cn/ ), 首页下面的财经频道是 (http:〃finance. sina. com. cn/), 财经频道下面的理财子频道是 (http://finance, sina. com. cn/money/index. shtml)。关键词规贝!]是根据网页相关 关键词进行判断,本规则遵循中国互联网络信息中心(CNNIC)等组织发布的《关键词 网络定位服务解析协议规范》进行关键词判断。因此,根据过滤规则算法判断,随 着其他网页打开的Flash广告页面可以及时过滤,而高级别的网页(首页、 一级子 网页等)可以根据关键词等进行内容分类,为下一级的网页处理准备。网页切割模 块的工作流程是互联网内容由智能控制模块调度到网页切割模块后,模块中智能 Agent技术建立过滤规则算法,在保证不损害原始页面的情况下,对页面进行合理 分类和净化。净化后网页中的"噪音"内容自动删除(或进入回收站),有效内容经 分类后作为一级子网页继续分类和净化,直到网页进入单一主题无法再分类和净化 为止,譬如,新闻栏目的一则消息。网页切割模块处理过的网页进入下一流程网页 快照模块。 网页快照模块网页快照模块能够在本地保存网页被采集时的内容,正如该网页被用照相机拍
下一幅快照一样,所以称之为网页快照。本系统的网页快照技术利用HTML语法在计 算机内存图形空间中重构页面,将图形空间中的文本转换为图像的技术。多路径的 快照技术,就是快照不是简单将某一个页面抓下来,而是通过适当算法,将主页面 里重要的连接路径指向的子页面一并抓下来。互联网的网页经过网页切割模块的分 类和净化,有效的网页通过网页快照智能Agent能够自动对所访问附b服务器进行 多路径的页面快照处理,醤如可以对页面链接权重最高的50—100个链接页面同时 进行快照缓冲。网页快照模块在智能控制模块的调度下,可以根据网页切割模块处 理过的分类与净化信息,运用服务器的并行处理系统,同时对多路径的页面进行快 照处理,提高了快照系统的效率。 图像处理模块图像处理模块对网页快照模块的快照进行先进的图像处理,使网页快照满足无 线上网的要求。主要包括图片轻量化技术,通过先进压縮技术,保证图片分辨率高, 图片重量小,替如,本技术可采用美国电话与电报实验实(AT&TLabs)的"DjVu" 压縮技术,压缩后图片可达标准bitmap格式的1/100,—副1024*768像素大小的 786K图片,压縮后大小为IOK左右。图片实时技术/分时传递,就是快照图片实时生 成,生成的图片片段,利用图片流实时传递到用户终端,不需要用户等待整个图片 完全抓下来,才可以看到。本系统的图片实时技术,分时传递图片(对于页面下载 的连续性,对快照也采用连续快照模式,保证用户浏览的实时性)。细节层次技术 (level of detail, LOD),以用户移动终端的分辨率为基础,建立网页快照图片缓冲, 随着用户的详细主题的査看过程,在缓冲服务器上选择最适合的LOD图片,譬如, 根据网页的级别建立不同的网页快照图片缓冲,如首页、 一级子网页、二级子网页 等。本系统创新地将3D几何中的技术应用到2D图片的处理,采用限时图形绘制技 术来满足手机用户的交互操作。 智能控制模块
智能控制模块是本发明的网页智能快照技术的核心,它就像人的大脑一样控制其他的各功能模块。替如,页面切割模块利用智能控制模块的Agent技术建立过滤 规则算法,才能启动网页的分类和净化。另外,智能控制模块也是整个系统的调度 中心,主要起到任务分配、各模块间消息转发及各模块调度作用。用户的查询请求 由智能控制模块传到互联网,然后经过网页智能快照技术各模块的处理反馈给用户。 当然由于智能控制模块的Agent具有预处理功能,用户的大多数的请求,已储存在 网页快照的缓冲中,因此,智能控制模块可以对用户的请求做出快速的反应。 参见图2所示,本发明的网页智能快照系统的运行方法的步骤包括1) 传入网页,由互联网传入网页;2) 网页切割,对页面进行合理分类和净化,根据关键词进行判断与主题内容 相关的网页传送至3);与主题内容无关的干扰信息(如广告等)传送至回收站;3) 网页快照,把网页拍成快照;4) 图像处理,把网页快照压缩后分层、实时传送给手机(无线终端)用户。 本发明的网页智能快照系统运用了人工智能代理技术、网页快照技术、图像处理技术等开发的新一代网页快照技术其所涉及的关键技术具体如下。人工智能技术人工智能(AI, Artificial Intelligence)是计算机科学的一个分 支,它企图了解人类智能的实质,并生产出一种新的能以人类智能相似的方式作出 反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理 和专家系统等。有关专家引入了智能Agent的概念,以此作为AI的概念框架,将 AI定义为设计和建造理性的智能Agent,并把Agent行为的合理性作为评判智能的 标准。通过对Agent从感知外部环境,到实施行动,并最后对外部环境施加影响的 全过程,把AI中相互分离的主要领域,如问题求解,知识与推理,合乎逻辑的行动, 不确定知识与推理,学习以及通信、感知与行动等统一在智能Agent这一框架下, 形成了一个相互联系的整体。
网页快照技术网页快照能够在本地保存网页被釆集时的内容,正如该网页被 用照相机拍下一幅快照一样,所以称之为网页快照。所有网页快照信息都是保存在 设定的网站的服务器上,储存这些网页快照可以在该网站暂时出现故降时还可以通 过该网站的缓存浏览该网页的内容。当然如果因为时间的原因,网页信息已经被替 换或者找不到服务器,本发明的储存的网页快照也可救急,替如,用户请求访问的 Internet网页被删除或连接失效时,可以通过访问本系统缓冲中的网页快照来査看网 页内容。虽然网页快照中的信息可能不是最新的,但在网页快照中査找资料要比在 实际网页中快得多,毕竟它是保存在本发明的设定网站的髙性能的服务器上的。图像处理技术先进的图像快速处理系统,主要包括图片轻量化技术,通过先 进压缩技术,保证图片分辨率高,图片重量小;图片实时技术,分时传递图片(对 于页面下载的连续性,对快照也采用连续快照模式,保证用户浏览的实时性);细节 层次技术(level of detail, LOI)),以用户移动终端的分辨率为基础,建立网页快照 图片缓冲,随着用户的详细主题的査看过程,在缓冲服务器上选择最适合的LOD图 片。
权利要求
1、一种网页智能快照系统,其特征是,包括一网页切割模块,能过滤互联网的干扰信息;其输入端连接互联网;一网页快照模块,其输入端连接所述网页切割模块;一图像处理模块,其输入端连接所述网页快照模块;一智能控制模块,用于执行用户指令,控制快照过程;分别连接互联网、网页切割模块、网页快照模块、图像处理模块和终端用户。
2、 一种权利要求l所述的网页智能快照系统的运行方法,其特征在于,方法的 步骤包括1) 传入网页,由互联网传入网页;2) 网页切割,对页面进行合理分类和净化,根据关键词进行判断与主题内容 相关的网页传送至3);与主题内容无关的干扰信息传送至回收站;3) 网页快照,把网页拍成快照;4) 图像处理,把网页快照压縮后分层、实时传送给无线终端用户。
全文摘要
一种网页智能快照系统及其方法,涉及计算机网络技术领域;涉及解决向手机传送网页的技术问题;该系统包括一输入端连接互联网的网页切割模块,一输入端连接网页切割模块的网页快照模块,一输入端连接网页快照模块图像处理模块,一智能控制模块,用于执行用户指令,控制快照过程;分别连接互联网、网页切割模块、网页快照模块、图像处理模块和终端用户。该方法的步骤包括1)传入网页,由互联网传入网页;2)网页切割,对页面进行合理分类和净化,根据关键词进行判断与主题内容相关的网页传送至3);与主题内容无关的干扰信息传送至回收站;3)网页快照,把网页拍成快照;4)图像处理,把网页快照压缩后分层、实时传送给无线终端用户。
文档编号H04Q7/22GK101132446SQ20061014173
公开日2008年2月27日 申请日期2006年9月28日 优先权日2006年8月23日
发明者宏 林, 鲍劲松 申请人:上海万纬信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1