网络内容在电纸书上的展示方法

文档序号:6597853阅读:185来源:国知局
专利名称:网络内容在电纸书上的展示方法
技术领域
本发明涉及一种展示方法,特别涉及一种利用电子墨水在电纸书上展示网络内容
的方法。
背景技术
科学技术的发展,使得E-Ink技术越来越多的应用于显示阅读方面。E-Ink—般称 之为电子墨水技术(电泳式电子纸),它是一种屏幕技术,E-Ink的电子纸由电子墨水及两 片基板所组成,它上面涂有一种由无数微小的透明颗粒组成的电子墨水,颗粒直径只有人 的头发丝的一半大小。只要调整颗粒内的染料和微型粒子的颜色,便能够使电子墨水展现 色彩和图案来。当这种电子墨水被涂到纸、布或其他平面物体上后,人们只要适当地对它予 以电击,就能使数以亿计的颗粒变幻颜色,从而根据人们的设定不断地改变所显现的图案 和文字。电子墨水具有包括刷新速度快、易读性,柔性,廉价制造和低功耗的优点。
随着电子墨水技术的日益流行以及人们对互联网信息的依赖,在移动设备上方便 即时的查看互联网信息已经成为大众的需求。但由于大多数网页仍然是为PC计算机的标 准显示器而设计的,他们在移动设备上的显示存在着缺陷第一,由于移动设备的屏幕受硬 件限制,较宽的网页在较小的设备上无法很好的显示,需要根据显示屏对网页进行优化和 过滤,比如黑白屏和彩色屏,大屏和小屏,电子纸屏和LCD屏;第二,由于移动设备的目的性 更强,而且网络运营商往往会按照流量收费,因此移动用户对于内容的选择性更加强烈,需 要根据内容对网页进行优化和过滤,比如是否显示广告,是否显示不适合阅读的内容;第 三,由于移动设备对于电池要求较高,需要通过优化网页达到节能的目的;第四,由于互联 网信息的及时性特征,上述的优化和过滤需要在一定时间内完成,否则不能满足快速阅读 的需求;第五,虽然目前市场上部分网页推出了移动设备版本,比如WAP版、3G版、RSS版,但 是这些网站只是所有网站中的凤毛麟角,而且他们不能灵活的根据不同的移动设备进行灵 活的优化。

发明内容
本发明的目的在于克服现有技术的不足,提供一种网络内容在电纸书上的展示方 法,以满足客户对于网页易读性,费用低和低功耗的需求。 为了达到上述目的,本发明采用的技术方案是一种网络内容在电纸书上的展示 方法,用于即时展示适应移动设备的网页,依次由页面分解、选择过滤、页面单元过滤、页面 整合渲染四个步骤组成。原始页面经过页面提取后分割为一系列页面单元,根据从页面单 元的信息,确定页面的具体分类从而选择过滤器。之后,通过选定的过滤器过滤设备不支持 的页面单元,过滤移动设备用户不需要的页面单元(比如导航条,用户评论等)。最后,系统 将筛选过后的页面单元整合后发往客户端并重新渲染,在客户端设备上显示适合以电纸书 为代表的移动设备阅读的页面。 与现有技术相比,本发明的有益效果是第一、适用性范围广,可以转化互联网上
3的所有网页;第二、灵活。本方法通过简单的配置,可以使用于不同的移动设备;第三、提 高了移动设备显示屏的适用范围,比如,使得电子油墨(E-Ink)等不适合浏览网页的屏幕, 可以容易的浏览网页;第四、增强了用户体验,减少了与用户无关的内容,节约了流量费用; 第五、速度快,用户基本不会体会出来延迟。


图l为本发明的原理框图;
图2为本发明的系统结构图。
具体实施例方式
本发明的设计方案在于克服现有技术的不足,提供一种网络内容在电纸书上的展 示方法,以满足客户对网页易读性、费用低和低功耗的需求。下面结合实施例参照附图进行 详细说明,以便对本发明的技术特征及优点进行更深入的诠释。 本发明的原理框图如图l所述,依次由页面分解、选择过滤、页面单元过滤、页面 整合渲染四个步骤组成。原始页面经过页面提取后分割为一系列页面单元,根据从页面单 元的信息,确定页面的具体分类从而选择过滤器。之后,通过选定的过滤器过滤设备不支持 的页面单元,过滤移动设备用户不需要的页面单元(比如导航条,用户评论等)。最后,系统 将筛选过后的页面单元整合后发往客户端并重新渲染,在客户端设备上显示适合以电纸书 为代表的移动设备阅读的页面。 下面结合图进行进一步说明,如图2所示,该方法所所依托的系统依次由数据获
取层、分解层、选择过滤层、过滤层、数据重组层和数据整合渲染层组成,整个转换过程可以
分为四个步骤 步骤一页面分解 基本功能将页面分解为一系列页面单元。 输入原始页面的亂(Uniform/Universal Resource Locator的縮写,统一资源 也被称为网页地址,是因特网上标准的资源的地址)。 输出一个页面单元的集合,其中绝大多数页面单元可以通过renderengine的 API (Application Programming Interface,应用程序编程接口 )直接访问。
页面分解步骤由数据获取层和分解层共同组成。对于每一个需要处理的网页。系 统将原始页面转化为若干页面单元的集合,并收集每个页面单元的内容和位置信息。每一 个页面单元都是一个基本信息单位,并在渲染后的页面上占据一定的位置。 一个链接、一个 文字域、一个表格或者一个图面都是页面单元。每一个页面单元都包含其在页面显示位置 的信息。 一个页面单元还能够同时包含其他页面单元。同时并行使用三个开源html渲染 引擎,渲染引擎将下载下来的html页面直接转化为页面单元的集合,而最终使用的页面单 元集合就是三个渲染结果的交集。从而确保页面不出现非标准展示的信息。
步骤二选择过滤 基本功能根据从页面单元等信息,确定需要使用的过滤器。
输入信息原始页面数据、页面单元集合数据。
输出信息需要使用的过滤器。
因为并不是所有的页面单元都适合在移动设备上展示的,所以需要对页面单元集 合中的元素进行过滤,筛除不适合在便携式设备上展示的内容。比如Flash或者GIF动画, 就非常不适合在使用E-ink屏幕技术的电纸书阅读器上观看。此时,我们选择使用一系列 的过滤器去筛选页面单元中不适合在电纸阅读器上观看的部分。 系统主要包括三种类型的过滤器。第一类过滤器是和页面的分类结果相关的,只 有当一个页面被分为特殊的分类的时候,这种过滤器才会被触发,我们称这类过滤器为"分 类过滤器";第二类过滤器是和特定的现实设备相关的,我们称这类过滤器为设备过滤器, 这类过滤器的主要作用是去掉那些无法和电纸书设备显示模式兼容的页面单元;第三类过 滤器是内容过滤器,这类过滤器完全按照页面单元所包含的内容来决定是否保留对应的页 面单元。 其中对于分类过滤器的选择方法如下根据从页面对象抓取的信息,对输入网页 进行分类,不同类型的网站对信息的处理方式是非常不同的。根据从页面单元中提取出来 的信息,为页面标定类别,并把页面的类别作为重要的参数,使用在对页面单元过滤器的选 择中。 页面分类步骤通过对页面单元的分析,决定特定网页归属的类别。 一般情况下, 页面的分类按照以下步骤进行首先通过对页面单元的统计得到分类的参数。每一个参数 可以是数值型,也可以是字符串型。比如,一个页面对应的标题页面单元的文字内容,就是 作为页面分类的一个参数。通过收集分类参数的值并代入事先训练好的分类模型,就可以 通过自动化的方式得到页面的类别信息。实现过程中,一个页面的分类标签可以是新闻,博 客,电子商务等品类中的一个。而每一个分类标签,都有自己独有的页面单元过滤器,这些 过滤器会在下一步中,用来过滤特定的页面单元。
步骤三页面单元过滤 基本功能应用过滤器减少需要展示的页面单元的数量。
输入页面单元的集合以及选中的过滤器集合。
输出一个精简过的页面单元集合。
在现实生活中,通过应用过滤器的方式减少需要显示的页面单元的数量。每一个
过滤器都会拦截满足特定条件的页面单元,使其无法最终在用户终端显示出来。
步骤四页面重组整合渲染 基本功能将筛选过后的页面单位重组整合后发往客户端,并重新渲染展示。
输入保存在服务器上的页面单元集合。
输出在客户端设备上显示处理过的页面。 根据终端设备的配置和用户的使用偏好,对过滤后的页面进行重新渲染。 一旦页 面单元过滤完成,剩下被选中的页面单元就需要重新进行组合,以便在客户端设备上展示 出来。可以用以下两种方式展示新页面第一,剩余的页面元素按照一定的逻辑规则写入业 界标准的数据格式,这样的数据传到客户端一后,会按照标准的流程对页面的内容进行渲 染和展示;第二,页面单元集合被直接送到了客户端设备,由客户端设备直接进行调整传来 页面元素的标记位置。 页面重渲染采用分步的方式,筛选之后的页面单元集合首先转化成为XML数据文 件,传输到客户端以后根据客户端的具体设置重新组织展示出来。在系统中,最终显示界面可能存在两种情况一是一系列头条消息的列表,用户随便点击一个就可以直接看到相关 的内容页面;二是经过简化过的内容页面,在这个页面中,用户可以看到经过精简过的页面 内容。
权利要求
一种网络内容在电纸书上的展示方法,用于即时展示适应移动设备的网页,其特征在于该方法依次由页面分解、选择过滤、页面单元过滤、页面重组整合渲染四个步骤组成。
2. 根据权利要求1所述的网络内容在电纸书上的展示方法,其特征在于所述的步骤依托于依次由数据获取层、分解层、选择过滤层、过滤层、数据重组层和数据整合渲染层组成的系统。
3. 根据权利要求2所述的网络内容在电纸书上的展示方法,其特征在于所述的数据提取层和分解层组成了页面分解步骤,页面经过页面提取后成为原始数据提供给分解层,分解层通过渲染引擎将页面直接转化为页面单元的集合。
4. 根据权利要求3所述的网络内容在电纸书上的展示方法,其特征在于所述的经过数据分解的页面单元进入选择过滤层,根据设备信息,以及页面的分类,选择合适的过滤器。
5. 根据权利要求4所述的网络内容在电纸书上的展示方法,其特征在于所述的页面单元经过选择的过滤器,进行基于分类的过滤,基于设备的过滤以及基于内容的过滤。
6. 根据权利要求5所述的网络内容在电纸书上的展示方法,其特征在于所述的经过过滤的页面单元进入数据重组层,对数据进行实体检测、协同式聚类、个性化语意分析、时间序列分析,从而将无序的网页单元整合成为有序的集合。
7. 根据权利要求6所述的网络内容在电纸书上的展示方法,其特征在于所述的经过数据重组的页面单元集合进入位于数据整合层,将筛选过后的页面单元整合成为一个整体。
8. 根据权利要求7所述的网络内容在电纸书上的展示方法,其特征在于所述的经过整合后的页面单元在在客户端设备上显示成为适合移动设备阅读的页面。
9. 根据权利要求1 8所述的网络内容在电纸书上的展示方法,其特征在于整个转换过程在服务器端完成,用时少于1秒。
全文摘要
本发明公开了一种网络内容在电纸书上的展示方法,用于即时展示适应移动设备的网页,依次由页面分解、选择过滤、页面单元过滤、页面整合渲染四个步骤组成。原始页面经过页面提取后分割为一系列页面单元,根据从页面单元搜集的信息、设备的特性以及页面的具体分类选择过滤器,通过选定的过滤器过滤设备不支持的页面单元以及移动设备用户不需要的页面单元。最后,系统将筛选过后的页面单元重组整合后发往客户端并重新渲染,在客户端设备上显示。本发明具有适用性范围广、灵活、读取方便快捷、节省流量费用等优点,可以满足各种移动设备用户的需求,特别是对于电纸书类使用特殊屏幕的产品尤为适用。
文档编号G06F17/30GK101794301SQ201010104330
公开日2010年8月4日 申请日期2010年2月1日 优先权日2010年2月1日
发明者黄峥 申请人:东莞市乐其网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1