Www转换技术的制作方法

文档序号:6352765阅读:503来源:国知局
专利名称:Www转换技术的制作方法
技术领域
本发明涉及一种无线互联网的页面处理、分析、计算和显示技术,主要用
于通过转换引擎将适宜于微机访问的WWW页面转换为适宜于手机访问的WAP页面。
背景技术
目前,大部分手机等小屏幕移动终端只能访问WAP网站,而无法访问WWW 网站。但是,可供手机等直接访问的WAP网站数量较少,大部分的企业、个人、 政府等建立的网站基本上都是WWW网站,这些网站只能使用PC正常浏览和访 问。为充分利用现有的www网站资源供手机等访问,通常可以采用作为中间桥 梁的转换引擎(转换代理服务器)将适宜于PC访问的www页面转换为适宜于 手机访问的WAP页面,例如中国CN1613105A号发明专利公开说明书公开了 一 种用于在小屏幕客户终端的显示屏上显示超文本标记语言文档的方法,该方法 通过应用至少一种客户端页面样式来将所述HTML文档重新格式化,从而调整 所述重新格式化文档的宽度以适应所述显示屏的宽度,并在所述显示屏显示所 述重新格式化文档。所述HTML文档重新格式化的步骤包括将所述HTML文档中 的表格单元转换为块级元素;忽略宽度超过第一预定尺寸的图像;忽略宽度小 于第二预定尺寸的图像;忽略宽度和高度等于预定的一组宽度和高度其中之一 项的图像;按比例缩小尺寸超出第三预定尺寸的图像;所述图像的所述尺寸的 参数没有在所述HTML文档中作为属性出现,则确定所述尺寸为伪属性;将所 述HTML文档中的定位元素转换为块级元素;忽略后续换行符,从而縮小所述 重新格式化文档的纵向尺寸;将不可分空格字符转换为常规空格字符,从而缩小所述重新格式化文档的水平尺寸;还可以根据需要将页面放大和缩小。经过 该方法的转换,人们可以通过手机等'J、屏幕移动终端方便地访问和浏览WWW 网站页面的主要内容。但是,由于这种转换方法不能判断手机访问的网页是否 是需要进行转换的WWW网页,难以在实际中推广使用;另外,对文字部分没有 进行必要的甄别,使用户不关注的大量信息显示在屏幕上,影响对有用信息的 浏览和查看。

发明内容
为克服现有技术的上述缺陷,本发明提供了 一种将WWW网页转换为WAP 网页的方法,该方法不仅可以进行而W网页内容的转换,而且可以识别哪些网 页是需要转换的www网页,并在转换过程中将人们较少关注的信息隐藏起来。
本发明实现上述目的的技术方案是 一种将WWW网页转换为WAP网页的 方法,包括下列步骤 .
步骤A,接收客户端访问某一 URL的请求,根据L'RL进行对网页是否是— WWW网页进行初步判断;
步骤B,获取页面内容; '
步骤c,对可能不是而w网页的网页做进一步的判断,确定其是否是而w
网页;
步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各
区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩
小超过设定大小的图片;
步骤D,将转换后的页面返回给客户端。
由于本发明在接到客户端请求后,首先根据URL对用户请求访问的网页是 否是WWW网页进行初步判断,并对可能不是而W网页的网页在获得页面内容后进行进一步的判断,由此可以准确地判断出该网页是否是www网页,由此克服 了现有技术不能对网页性质做出准确判断的缺陷;由于可以将转换后的页面宽 度设定为适应于客户端的宽度,并且不同区块依据自上到下的方式进行排列, 由此不需要进行纵向滚动,方便了人们浏览;由于将超过一定限度的大图片进 行了缩小,使这些大图片得以在手机上显示,由此克服了将大图片一律删除的 缺陷。
具体实施例方式
本发明的主要内容包括两方面 一是判断客户端请求访问的网页是WAP网 页还是輕W页面,二是对页面进行格式转换和页面重排,在抓取WWW网页的内 容后,对页面、文字、表单、图片进行分析,对分割出来的各区块依据自上到 下的顺序重新排列,将htin 1的格式转换为wm 1或xhtmi等适于手机浏览的格 式,将图片进行格式转换、过滤和缩小,以适应手机的显示能力。
可以通过预设显示宽度的方式确定显示宽度,也可以通过解析客户端.UA 的方式获得客户端的显示器参数,依据客户端显示器的实际情况设定适宜的显 示宽度。然后根据显示宽度的要求将段落折行,将页面各区块以及同一区块的 各段落依据从上到下的方式进行排列。
本发明的总体步骤在前面的发明内容中已经介绍,不再赘述。这里,仅对 几个重要的具体实施方式
做进一步的说明
(1 )识别客户端请求访问的网页是WAP网页还是而W页面的方式包括
两步
第一步是步骤A中的初步判断如果IITTP请求中的域名以wap. ***、m. ***、 3g. ***关键字开头,则判定是WAP网页,不是輕W网页;
第二步是步骤C中的进一步判断分析页面的HTTP HEAD中的Content-Type值,这个值描述了当前页面的格式,如果是"text/vnd. wap. wmr或者是 "application/vnd. wap. wmlc",则分析其中是否包含关键字"wap"或"wml",若 包含这两个关键字中的任意一个,则认为是WAP页面,否则需要进一步对页面 文本内容的格式分析,wap格式网页会以"〈?xml "标签开头,并且XML才艮节点 为"〈誦1〉",满足这两个条件的就认为是wap网页,否则就是WWW网页。 (2 )从Htmi到麵LAXHTML格式的转换
目前,手机WAP的格式是WML和XHTML,格式的转换是转换引擎的重要工作, 可依据现有技术。
(3)对页面布局的重新排列将整个页面分割为多个区块,然后按照选定 的显示宽度进行折行,并对各区块的分布方式进行重排,重排页面要达到的一 个重要目标是保证用户不再需要进行左右滚动,因此应采用自上到下排列方 式,将页面区块从上到下排列,各区块的排列次序可以依据满足用户需要和便 于处理的原则确定,通常有两种排列方式 一是以原来页面区块从左到右的顺 序确定重新排列的顺序;二是根据区块的内容或属性依据预设的优先次序顺序 排列,区块内容内容性质可以根据区块的属性分析确定。
(4 )对图片格式和尺寸的转换对页面中的图片进行的相应转换主要有三 个方面 一是格式转换,可以依据现有技术,使之能够被手机等客户终端显示; 二是缩放,主要是缩小,使图片的大小适合于客户移动终端的屏幕显示;三是 过滤,自动判断图片的重要性,对于不重要的图片不予显示,或者留白由用户 自己决定是否显示。图片的重要性可以根据图片的url、 alt、以及尺寸等进 行判定。比如,在黑名单中的图片不予显示,长宽比失调的图片也不显示等。
(5)无用和/或次要信息在页面中的折叠隐藏在互联网网站页面中,有 些区块在手机上很占用屏幕空间,但又没有多少用处,在转换过程中可以将这些无用和/或次要信息的区块进行折叠隐藏,并通过超链接标识建立以折叠隐 藏的区块为目标的超链接,所述超链接的标识可以采用原区块缩略文,并可以 在原区块缩略文的两端加上"+++" 、 "++"或"+ "等适宜形式的折叠符号, 因此,折叠隐藏后在原区块的位置就出现一个"+++原区块缩略文+++"或其它 适宜形式的超链接,所述区块缩略文可以根据实际需要和便禾。的方式进行确 定,例如采用该区块正文的前两个文字和第一个名词等等。用户点击此超链, 则相应区块被展开而不再被折叠,'用户可以见到被折叠的内容。而未折叠的内 容对于用户来说是一目了然,由此也达到了主要内容直达的效果。
应注意下列几个事项
(1) HTTP头信息中包含页面格式信息,但会有错误的情况出现,在此情 况下可根据页面内容进行智能判定, 一般可以由转换引擎自动判定出各种超文 本格式、纯文本和图片等。
(2) 对于文本和超文本,字符编码类型在HTTP头中也有声明,但也会有 错误情况出现,在此情况下可根据页面内容智能判定编码类型,常见的编码有 UTF8和GB2 312.等。
(3 )在现有技术下,转换引擎可以自动将原HTML格式的页面转换为适于 手机浏览的WML和XHTML格式的小页面,在此过程中应进行分页处理、超链接 变换以及图片变换等。
(4)图片转换是一个必要的方面,应将大图片转换为适应手机屏幕大小 的小图片,并且在转换过程中还应将图片格式变换为手机可识别的格式。
(5 )还可在页面中设置或插入音频和视频等的多媒体转换功能。
权利要求
1.一种将WWW网页转换为WAP网页的方法,其特征在于包括下列步骤步骤A,接收客户端访问某一URL的请求,根据URL进行对网页是否是WWW网页进行初步判断;步骤B,获取页面内容;步骤C,对可能不是WWW网页的网页做进一步的判断,确定其是否是WWW网页;步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩小超过设定大小的图片;步骤D,将转换后的页面返回给客户端。
2. 如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于 所述步骤D中对显示宽度的确定方式为通过预设显示宽度的方式确定显示宽 度,或者通过解析客户端UA的方式获得客户端的显示器参数,依据客户端显 示器的实际情况设定适宜的显示宽度。
3. 如权利要求2所述的将WWW网页转换为WAP网页的方法,其特征在于 根据显示宽度的要求将段落折行
4. 如权利要求所述的将W而l"]页转换为WAP网页的方法,其特征在于 所述步骤A中的初步判断方式是如果I-ITTP请求中的域名以wap. ***、 m. ***、 3g. ***关键字开头,则判定是WAP网页,不是WWW网页。
5. 如权利要求4所述的将WWW网页转换为W,'\P网页的方法,其特征在于 所述步骤C中的进一步判断分析页面的HTTP HEAD中的Content-Type值, 这个值描述了当前页面的格式,如果是"text/vnd. wap. wml"或者是"a卯lication/vnc1. wap.训ilc",则分折其中是否包含关键字"wap"或"wmi",若 包含这两个关键字中的任意一个,则认为是WAP页面,否则需要进一步对页面 文本内容的冲各式分析,wap冲各式网页会以"〈?xmr标签开头,并且XML根节点 为"〈wml〉",满足这两个条件的就认为是wap网页,否则就是WWW网页。
6. 如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于 所述区块重排的方式是以原来页面区块从左到右的顺序确定重新排列的顺序。
7. 如权利要求1所述的将WWW网页转换为WAP网页的方法,其特征在于 所述区块重排的方式是根据区块的内容或属性依据预设的优先次序顺序排列定。 ..
8. 如权利要求1所述的将西W网页转换为WAP网页的方法,其特征在于在图片转换中,自动判断图片的重要性,对于不重要的图片不予显示,或者留 白由用户自己决定是否显示。
9. 如权利要求1、 2、 3、 4、 5、 6、 7或8所述的将WWW网页转换为WAP 网页的方法,其特征在于将无用和/或次要信息在页面中的折叠隐藏。
10. 如权利要求9所述的将WWW网页转换为WAP网页的方法,其特征在于 将无用和/或次要信息的区块进行折叠隐藏,并通过超链接标识建立以折叠隐 藏的区块为目标的超链接,所述超链接的标识采用原区块缩略文,并在原区块 缩略文的两端加上折叠符号,用户点击此超链,则相应区块被展开而不再被折 叠。
全文摘要
本发明涉及一种将WWW网页转换为WAP网页的方法,其特征在于包括下列步骤步骤A,接收客户端访问某一URL的请求,根据URL进行对网页是否是WWW网页进行初步判断;步骤B,获取页面内容;步骤C,对可能不是WWW网页的网页做进一步的判断,确定其是否是WWW网页;步骤D,对WWW网页进行页面转换,首先确定显示宽度,然后将页面的各区块从上到下重新排序,将页面内容的格式转换为适于手机浏览的格式,并缩小超过设定大小的图片;步骤D,将转换后的页面返回给客户端。转换时,还可以通过建立超链接方式将无用和/或次要信息在页面中的折叠隐藏。本发明不仅可以进行WWW网页内容的转换,而且可以识别哪些网页是需要转换的WWW网页,并在转换过程中将人们较少关注的信息隐藏起来。
文档编号G06F17/30GK101526953SQ20091007676
公开日2009年9月9日 申请日期2009年1月19日 优先权日2009年1月19日
发明者杨金钰, 谢茂培 申请人:北京跳网无限科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1