用于移动设备的文档处理的制作方法

文档序号:7938169阅读:214来源:国知局

专利名称::用于移动设备的文档处理的制作方法
技术领域
:本说明书涉及处理用于在移动设备上显示的信息。
背景技术
:随着计算机和计算机网络变得越来越能够访问各种基于动态web的内容,人们正在要求更多的途径来得到那些内容。具体地,人们现在希望在路上、在家里或在办公室中访问先前仅从挂到适当规定网络的固定连接个人计算机而可获得的动态内容。他们希望从他们的蜂窝电话观看具有动态加载的导航菜单的网页、从他们的个人数字助理(PDA)跟踪在线购物车中的购买、并且从他们的掌中宝(palmtops)以在线的形式确认所输入的信息。他们也希望无论在本地、国内还是国际旅行时在易于使用的便携式设备中获得所有这些动态内容。便携性通常要求设备尺寸较小,这进而限制了可用于显示内容的屏幕面积。当在较小的屏幕上显示时,该限制可能要求便携式设备将内容縮减到难以辨认或不能识别的状态。替代地,可以以较大尺寸来显示内容,但是用户必须进行滚动以观看内容的某些部分。
发明内容—般性地,该文档描述了生成与由客户端设备请求的电子文档相关的内容表(tableofcontents)。本文档也描述了减少对所请求的电子文档中的样板文件的强调和对登录信息进行操作以使得客户端设备的用户更易于访问。在第一一般性方面中,描述了一种处理用于在移动设备上显示的信息的计算机实现的方法。该方法包括从移动设备接收对于电子文档的请求;基于所述电子文档的格式化信息或内容来识别用于内容表(ToC)的条目;以及输出用于插入在所述电子文档中的、由所述移动设备上的应用使用以使得用户能够从所述电子文档的第一观看部分访问所述ToC的ToC标识符,所述电子文档的第一观看部分基本上显示在可用于向用户显示的所述电子文档的其他部分之前。在第二一般性方面中,描述了一种系统。该系统包括接口,从移动设备接收对于电子文档的请求;以及解析器,基于所述电子文档的格式化信息或内容来识别用于内容表(ToC)的条目。该系统还包括内容表生成器,输出用于插入在所述电子文档中的、由所述移动设备上的应用使用以使得用户能够从所述电子文档的第一观看部分访问所述ToC的ToC标识符,所述电子文档的第一观看部分基本上显示在可用于向用户显示的所述电子文档的其他部分之前。在第三一般性方面中,描述了一种计算机实现的方法。该方法包括在第一服务器处从客户端设备接收对于在第二服务器处托管的电子文档的请求;从所述第二服务器检索所请求的电子文档;以及生成用于所述电子文档的内容表(ToC)。基于所述电子文档中的格式化信息或内容来生成所述ToC中的条目。该方法还包括与所述电子文档相关联地向所述客户端发送所述ToC,用于访问所述电子文档中的内容。在另一一般性方面中,描述了一种处理用于在移动设备上显示的信息的计算机实现的方法。该方法包括存储初始电子文档的第一内容;从移动设备接收对于第二电子文档的请求;以及将所述初始电子文档的第一内容与所述第二电子文档的第二内容进行比较,以确定所述第二内容的至少一部分是否是超过相似性阈值的重复内容。该方法还包括输出用于在所述移动设备上显示的、不再强调(deemphasize)所述重复内容的至少一部分的修改后的第二文档。在一些实施方式中,该方法还包括通过改变所述重复内容的色彩来不再强调所述重复内容的一部分。例如,色彩可以被改变为灰色。此外,该方法还可以包括通过去除所述重复内容来不再强调所述重复内容的一部分。同样,该方法还可以包括通过用到所述重复内容的链接代替所述重复内容来不再强调所述重复内容的一部分。例如,所述链接可以包括所述重复内容的至少一部分。该方法还可以包括通过隐藏所述重复内容或减弱所述重复内容的声音来不再强调所述重复内容的一部分。在一些实施方式中,所述修改后的第二文档包括用于不再强调所述重复内容的一部分的重复内容标识符。例如,所述重复内容标识符可以包括标识非重复内容的开始的锚标签。在一些实施方式中,所述重复内容标识符被配置为控制所述移动设备以使得所述非重复内容被包括在向所述移动设备的用户显示的内容的第一部分中。所述第二修改后文档可以包括链接,该链接参考所述锚标签以使得当用户选择该链接时显示非重复内容。此外,重复内容标识符可以包括修改所述重复内容的外观或音频的标记标签。在一些实施方式中,所述重复内容包括文本、图像、视频、音频或其组合。所述方法还可以包括请求不再强调所述重复内容。例如,所述请求可以包括用于向上滚动以观看所述重复内容的命令。在另一个例子中,所述请求可以包括用于恢复先前去除的重复内容的命令。在另一个例子中,所述请求是在展开的第二观看位置中输出先前删简的重复内容。在另一个一般性方面中,描述了一种处理用于在移动设备上显示的信息的计算机实现的方法。该方法包括从移动设备接收对于电子文档的请求;为了与图形用户界面上的登录元素相关的内容而解析所述电子文档;以及输出用于插入在所述电子文档中的、由所述移动设备上的应用使用以使得用户能够从首先向所述用户显示的所述电子文档的第一观看部分访问所述登录元素的登录标识符。在一些实施方式中,所述方法还包括基于所述电子文档中的格式化标签来识别所述登录元素。例如,所述格式化标签可以包括指定从所述移动设备的用户接受输入的用户界面元素的输入标签。在另一例子中,所述登录标识符包括到所述登录元素的链接,当选择所述链接时,所述链接使得所述移动设备显示所述登录元素。在另一个例子中,所述登录标识符包括基本位于所述登录元素附近的锚标签。该方法还可以包括参考所述锚标签的链接,其中,选择所述链接使得所述移动设备显示包括所述登录元素的第二观看部分。此外,该方法还可以包括接收与所述登录标识符相关的控制的第一选择;以及在展开的第二观5看部分中输出所述登录元素。图1是处理用于在移动通信设备上执行的初始电子文档的示范性系统的示意图。图2是根据一个实施方式的、示出更多细节的图1的系统的框图。图3是当处理用于在移动通信设备上显示的初始电子文档时可以被执行的示范性操作的序列图。图4是包括内容表的转码电子文档的例子。图5是包括登录标识符的转码电子文档的例子。图6包括具有重复文本的縮减的转码电子文档的例子。图7是包括进度(progress)监视器的转码电子文档的例子。图8是可用于实现在该文档中描述的系统和方法的计算设备800、850的框图。在各个附图中类似的参考符号指示类似的元素。具体实施例方式图1是处理用于在移动通信设备104上执行的初始电子文档102的示范性系统100的示意图。移动通信设备104,也被称为远程设备,可以向服务器系统106发送对初始电子文档的请求,如被标为"A"的箭头所示。在一些实施方式中,服务器系统106向远程web服务器108转发该对初始电子文档的请求,如被标为"B"的箭头所示。响应于该请求,远程web服务器108可以向服务器系统106发送初始电子文档102,如被标为"C"的箭头所示。在一些实施方式中,初始电子文档102可以是网页。网页可以包括各种组件,诸如登录框、描述网页内容的标题、图像、视频、文本等。在一个例子中,当远程设备104的用户观看通过由服务器系统106执行的web搜索而检索的网页链接列表时发生由箭头A、B和C示出的过程。所述列表可以包括指定远禾呈web月艮务器108处的网页的网页链接,诸如http://www.remotewebserver.com/first_document,html。服务器系统106可以修改当用户选择上述web链接时访问的实际统一资源定位符(URL),以使得该链接首先指向服务器系统106,诸如在下述URL中http:〃w丽.google,com/u=www.remotewebserver.com/first—document,html。这里,"www.google,com"是服务器系统106的网络地址。URL中的"?u=www.remotewebserver.com/first_document.html"参数J旨示月艮务器系统106从远禾呈web月艮务器108请求位于"www.remotewebserver.com/first_document.html"处的初始电子文档102。服务器系统106可以包括用于处理初始电子文档102的转码器110。在一些实施方式中,转码器110可以基于初始电子文档102的格式化信息和内容生成内容表112(ToC)。例如,转码器110能够解析初始电子文档102以识别诸如标记语言标签的指示特定文本应当具有增加的字体大小、被加粗、被设为斜体或被以其他方式强调的格式化信息。被强调的文本可以被用于生成ToC112中的条目。此外,所显示的诸如文本和图像(以及它们的位置属性)的初始文档的内容可以被用于识别ToC条目。例如,转码器110可以使用段落开始处的文本来生成条目。在另一个例子中,与图像相关的文本,诸如关于图像的字幕,可以被用来生成条目。在另一个例子中,如果图像没有被显示,则转码器110可以使用替换显示的文本来生成ToC条目。在其他实施方式中,转码器110可以通过生成登录标识符114来处理初始电子文档102,该登录标识符114使得用户能够访问首先呈现给用户的请求电子文档的一部分上的登录元素。例如,转码器iio可以解析移动设备请求的电子文档以识别登录元素,诸如用于用户名和密码的用户输入框。然后,转码器110可以生成到包括该登录元素的电子文档的片段的链接。在一些实施方式中,转码器iio可以生成包括所请求的电子文档的内容以及到登录元素的链接的转码文档111。链接可以被插入到转码文档111的基本上首先向用户显示的一部分处,以使得用户可以通过点击该链接而"跳转"到登录元素。在另一个实施方式中,转码器110可以通过不再强调存在于电子文档中的重复内容来处理电子文档。例如,用户可以请求并在他的移动设备上观看第一电子文档,其中该第一电子文档包括描述产品的特征集的文本。如果请求包括描述该特征集的相同或类似文本的第二电子文档,则转码器110可以通过例如生成锚标签来生成不再强调重复文本的转码电子文档lll,所述锚标签使得移动设备能够显示不包括重复文本的电子文档的片段(例如,当被显示时,第二电子文档跳过重复文本并且显示具有非重复文本的部分)。重复内容不限于文本。在一些实施方式中,重复内容可以包括图像、音频、视频和在电子文档中包括的其他媒体或信息。在其他例子中,转码器110可以以其他方式生成不再强调重复文本的转码电子文档111,诸如使文本变成"灰色"、减小字体大小或用被显示为文本的删简版本的链接来代替该文本并当选择链接时让用户观看全部文本。在另一个例子中,转码器iio可以通过去除重复文本、用页面上的另一元素(诸如图像)隐藏重复文本或通过将该文本封装到用户界面元素中来不再强调该重复文本,如果用户希望显示该重复文本,则可以通过用户的选择来展开所述用户界面元素。如上所述,转码器110可以处理用户所请求的初始电子文档102,并生成转码的、或第二电子文档111。第二文档可以是web可访问的格式,诸如HTML(超文本标记语言)、可扩展标记语言(XML)和无线标记语言(丽L)。在一些实施方式中,第二文档可以包括ToC标识符116、ToC112、登录标识符114或重复内容标识符118。ToC标识符116可以是用于访问ToC112的链接,并且登录标识符114也可以是用于访问转码文档111中的登录元素的链接。在一些实施方式中,这两种链接可以被显示在转码文档111的基本上首先向用户显示的一部分中。用户可以选择链接以导航到包括元素的文档的另一部分,或者用户可以选择链接以展开用户界面元素从而展现登录元素或ToC。此外,ToC标识符116可以包括用于指示ToC的存在的标记标签,诸如HTML标签。在一些实施方式中,代替作为到ToC的链接的ToC标识符,可以在ToC标识符116之后显示ToC。例如,当向用户显示转码电子文档111时,在基本上首先向用户显示的文档的一部分中显示至少部分ToC112。在该例子中,ToC标识符116可以被显示设备用来指示ToC112应当被插入到由ToC标识符116所指示的点处,即向用户显示的转码电子文档111的第一部分中。在一些实施方式中,重复文本标识符可以包括插入在重复文本之前或之后的格式化标签,其向观看应用通知应当例如通过改变字体颜色、减小字体大小等而不再强调所述7文本。在其他实施方式中,重复文本标识符可以包括被插入在那个重复文本之后的锚标签。用于观看第二电子文档的应用可以使用该标签来首先显示在该标签之后发生的内容,而不是首先显示在该锚标签之前发生的重复文本。如图1所示,服务器系统106向远程设备104发送第二文档,如被标为"D"的箭头所示。然后,远程设备104可以向用户显示第二文档。图2是根据一个实施方式的示出更多细节的图1的系统的框图。图2示出了服务器系统106和与其通信的设备。服务器系统106可以被实现为例如因特网搜索提供者的通用系统的一部分。服务器系统106配备有接口202,以允许与诸如因特网的网络通信。服务器系统106可以与诸如远程设备104和远程web服务器108的各种设备通信。对于任一设备的通信流可以是双向的,以使得服务器系统106可以从所述设备接收诸如命令的信息,并且可以向所述设备发送信息。从设备接收的命令和请求可以被提供给请求处理器204,请求处理器204可以解释请求、将其与预定可接受的请求相关、并诸如以命令的形式向服务器系统106的另一组件将其进行传递以执行特定动作。例如,在其中服务器系统106是因特网搜索提供者的通用系统的一部分的实施方式中,请求可以包括搜索请求。请求处理器204可以使得搜索引擎206生成与搜索请求对应的搜索结果。搜索引擎206可以使用类似于在GooglePageRankTM系统中使用的数据检索和搜索技术。然后,使用响应格式器205,由搜索引擎206生成的结果可以被提供回原始请求者,所述响应格式器205对结果执行必要的格式化。为了其的正确操作,搜索引擎206可以依赖多个其他组件。例如,在每次做出请求时搜索引擎206可以参考网站的索引108,而不是搜索网站自身,以便更有效地做出搜索。可以使用由web爬行器(crawler)210收集和格式化的信息来扩增索引108,web爬行器210可以不断地扫描用于改变信息的潜在信息源。转码器110可以访问系统存储212。系统存储212可以是用于操作系统所需的文件(诸如应用、维护程序以及管理和报告软件)的一个或多个存储位置。在一些实施方式中,转码器110可以在系统存储212中存储转码的、或第二文档111。服务器系统106可以响应于对于初始电子文档102的将来的请求而发送所存储的第二电子文档。转码器110可以包括用于处理初始电子文档102的多个组件。解析器214可以识别初始电子文档102中与登录元素、用于生成ToC的元素和用于确定是否存在重复内容的元素相关的元素。例如,解析器214可以识别与HTML标题标签相关的文本。与标题标签相关的文本可以被传递给ToC生成器216,该ToC生成器216使用全部或部分文本创建关于ToC112的条目。在另一个例子中,解析器214可以将诸如文本的内容与在先前请求的页面中向用户显示的内容进行比较。在一个实施方式中,比较包括字符串比较,其中将当前所请求的电子文档中的文本与用户先前所请求的过去文档中的文本逐词进行比较。在一些实施方式中,过去文档可以是对于当前所请求的电子文档的请求之前紧挨着观看的文档。在其他实施方式中,可以将多个过去文档(例如,过去的5个文档)与当前所请求的文档进行比较,以确定是否存在重复文本。对于内容是否重复的确定可以基于相似性阈值。例如,如果90%(相似性阈值)的文本与用户先前观看的文本是公共的,则解析器214可以确定文本块是重复文本。可以由转码器110的管理员来设置该阈值。—旦重复内容被解析器214识别,则重复文本的位置或属性可以被传递给重复内容标识(RCI)生成器218。RCI生成器218可以创建用于不再强调该内容的标识符。例如,RCI生成器218可以生成用于插入在重复文本之后的锚链接,其中当在移动设备上显示所请求的文档时,该锚用于跳过重复文本并显示非重复文本。解析器214也可以识别初始电子文档102之中的登录元素。例如,解析器214可以识别指定诸如格式字段的用户输入元素的格式化标签,所述用户输入元素具有相当于"password(密码)"或"username(用户名)"的属性类型。登录元素的位置或用于生成登录元素的信息(例如,XML标签)可以被传递给登录标识符生成器220,登录标识符生成器220可以创建与登录元素相关的登录标识符。在一些实施方式中,登录标识符114是到如上所述的登录元素的位置的链接。在其他实施方式中,登录标识符114可以包括用于在与其初始电子文档102中的位置不同的位置处生成登录元素的信息。例如,登录标识符114可以指定所述登录元素应当被显示在转码文档111的顶部,以使得可以在加载转码文档111时观看到登录元素,而无需诸如向下滚动文档以定位登录元素的额外导航。解析器214可以使用应用编程接口(API)来解码初始电子文档102,以访问初始电子文档102的内容。例如,如果初始电子文档102是网页,则解析器214可以使用文档对象模型(DOM)API来访问网页的元素或文档对象。使用DOMAPI,解析器214可以利用诸如树的数据结构将文档对象从初始电子文档102加载到存储器中。DOM可以允许任意或者以与在初始电子文档102中指定的次序不同的次序来访问文档对象。可替换地,解析器214可以将输入初始电子文档102为一系列字符或者字符串。字符或字符串可以顺次与诸如HTML"〈inputtype二"password"〉"标签的、指定要识别的元素的存在的一组预定标识符进行比较,所述预定标识符可用于识别登录元素。在一些实施方式中,转码器110可以确定是否处理初始电子文档102。例如,转码器110可以包括已定约使得服务器系统106处理它们的网页的网站的列表。解析器214可以选择仅处理属于包括在该列表中的网站的那些网页。在另一个实施方式中,转码器110可以仅处理部分初始电子文档102。例如,初始电子文档102可以是网站www.website,com。该网站可以包含对所生成的包括登录元素或重复文本的内容做广告,其中第一广告主是che即cars.com,且第二广告主是expensivecars.com。expensivecars.com可以付费以使得转码器110处理其的广告。与expensivecars.com相关的标识符可以被记录在索引108中,访问索引108以确定是否应当处理特定电子文档。转码器110可以解析电子文档以确定其是否包含与索引108中的标识符匹配的标识符。如果找到匹配,则可以处理电子文档。这里,所述标识符可以是文本"expensivecars.com,,。转码器110可以检查电子文档并确定其从expensivecars.com的web服务器检索内容。因为expensivecars.com包括在索引108中,所以转码器110处理电子文档。然而,因为在索引108中不存在匹配条目,所以将不处理从che即cars.com网站检索内容的电子文档。转码器110也可以包括文档生成器。在一个实施方式中,文档生成器使用来自初始电子文档102的内容和来自ToC生成器216、RCI生成器218和登录标识符114生成器的信息来创建转码的、或第二文档111。此外,文档生成器可以修改第二文档中到其他网页的超链接,以使得它们被首先导向服务器系统106以便处理。例如,初始电子文档102中的元素可以具有指定到另一网页的超链接的相关HTML属性。网页可以位于第二远程web服务器。文档生成器可以向第二文档添加与初始电子文档102中的超链接对应的可点击链接。第二文档添加中的可点击链接可以包含服务器系统106的网络地址。以与上述搜索列表类似的方式,超链接首先将网页请求导向服务器系统106,其中服务器系统106将检索网页并在处理网页之后将其转发给远程设备104。例如,初始电子文档102可以包含到第二远程web服务器处的另一文档的下述超链接http://www.secondwebserver.com/another—document,html.文档生成器修改超链接以使得其首先被导向服务器系统106,诸如在下述URL中http://www.google,com/u=www.secondwebserver.com/another—document.html.图3是当处理用于在移动通信设备上显示的初始电子文档时可以被执行的示范性操作300的序列图。例如,操作300可以在服务器系统106中被执行。执行在计算机程序产品中存储的指令的处理器可以执行操作300。操作300开始于步骤302中来自诸如移动通信设备的远程设备对于第一电子文档的请求。例如,远程设备104的用户可以向服务器系统106发送对于第一电子文档的请求。在步骤304中,服务器系统从远程设备接收对于第一电子文档的请求。例如,服务器系统106可以从远程设备104接收对于第一电子文档102的请求。在可选步骤306中,服务器系统可以向远程web服务器做出对于第一电子文档的请求。在可选步骤308和310中,远程web服务器可以分别接收对于第一电子文档的请求并向服务器系统发送包括该第一电子文档的响应。例如,服务器系统106可以从远程web服务器108请求第一电子文档102,并且远程web服务器可以发送包括第一电子文档102的响应。在步骤312中,解析第一电子文档。例如,服务器系统106包括解析器214,其能够如关于图2所述的来解析第一电子文档102的元素。在步骤314中,识别ToC元素、登录元素和重复上下文。例如,在识别登录元素期间,解析器214可以将初始电子文档102中的格式化标签与所存储的格式化标签的列表进行比较,以确定初始电子文档102是否包括类型"password"的格式字段。在步骤316中,生成ToC标识符、登录标识符或重复上下文标识符。此外,也可以生成ToC条目。例如,解析器214可以选择位于指示段落开始的格式化标签(例如,〈p〉)之上的文本。该文本或该文本的一部分可以用于生成被显示为链接的ToC条目,当用户选择该链接时,该链接导航到所述段落。在一些实施方式中,ToC标识符可以是题目为"内容表"的链接,当被用户选择时,其可以导航到ToC条目的列表。在步骤318中,生成可以包括ToC标识符(和ToC)、登录标识符和重复上下文标识符的转码电子文档。例如,文档生成器222可以生成包括ToC和用于用户导航到ToC的链10接的网页。服务器系统将转码电子文档发送到远程设备。例如,服务器系统106可以使用接口202经由网络向远程设备104发送转码电子文档111。此外,在步骤322中,可以存储所生成的转码电子文档。例如,转码器110可以将转码电子文档存储在系统存储212中。在一些实施方式中,当接收到对于从其取得转码文档111的电子文档的后续请求时,转码器110可以检索并发送所存储的转码电子文档111,代替生成它。在步骤324中,远程设备显示转码电子文档。例如,接收转码电子文档111的远程设备可以执行显示所接收的文档的应用,诸如web浏览器。图4是包括内容表的转码电子文档的例子。在该例子中,通过选择标为"TableofContents(内容表)"的链接来访问ToC,其中当所请求的网页被加载到移动设备时该链接被嵌入在首先向用户显示的网页的顶部。在该实施方式中,ToC标识符包括该链接。当用户选择链接时,显示ToC。ToC可以包括基于诸如标题标签〈H1〉的、存在于所解析的初始网页中的HTML标签而生成的ToC条目。可以提取标题标签之间的文本并将其用作ToC条目。此外,从标题之后的文本中选择的摘录可以被附加到ToC条目,如图4所示。在一些实施方式中,ToC条目是将用户带到包括从其生成ToC条目的文本的电子文档的部分的链接。例如,如果从网页的中部提取文本"CoolNewPeople",则选择与该条目对应的ToC条目将使得移动设备显示网页中部的文本。在一些实施方式中,这通过生成被插入到基本在从其生成所述条目的文本附近的锚标签(例如,〈a〉)来完成。ToC条目参考锚,以便当选择ToC条目时移动设备(更具体而言,诸如浏览器的应用)定位该锚并显示由该锚参考的文本。在另一实施方式中(图4中未示出),文本"TableofContents"可以是当选择时展开以显示ToC条目的用户界面元素。例如,文本"TableofContents"旁边可以具有"加"号,指示当其被用户选择时该元素将展开。图5是包括登录标识符的转码电子文档的例子。在该例子中,登录标识符可以是标为"Login(登录)"的链接。当用户选择链接时,移动设备显示包括登录元素的转码文档的部分。在一些实施方式中,由解析器如上所述定位登录元素。文档生成器可以将锚〈a〉插入到登录元素附近(例如,前面)。登录标识符可以是参考该锚的URL,以使得当选择登录标识符时移动设备显示登录元素。在另一个实施方式中(图5中未示出),登录标识符包括可以用于生成登录元素的代码。登录标识符可以被显示在电子文档的顶部,以使得一显示页面用户就能看到登录元素。例如,这可以达到"剪切和粘贴"效果,其中登录元素被从电子文档中的不同片段移动到文档的首先向用户显示的部分(例如,在移动浏览器中显示的第一大块页面的顶部)。在一些实施方式中,不移动用于登录的原始代码,以使得登录元素仅仅是出现在电子文档的不同部分中,而不是被复制。以这种方式,登录元素可以出现在电子文档的多于一个的片段中。在另一个实施方式中,类似于与ToC标识符相关描述的用户界面元素,登录标识符可以是可展开用户界面元素的一部分。在其他实施方式中,不管登录元素在电子文档中被如何布置,登录元素都是可展开用户界面元素的一部分。例如,参照图5,登录元素被包括在标为"HideSection(隐藏片段)"的可展开用户界面元素中。图6是具有重复文本的縮减的转码电子文档的例子。更具体而言,该例子示出两个场景(scenario)。第一场景包括用户将看到没有重复内容中的縮减的两个屏幕。第二场景是用户将看到具有重复内容中的縮减的两个屏幕。在第一场景中,应用(例如,浏览器)显示具有关于照相机的信息的第一网页。用户选择向右箭头以导航到不同的网页。所显示的第二网页包括大量在第一网页中包含的相同文本。在图6中用变灰的框来指示类似文本。用户将不得不滚动或以别的方式手动地导航过重复文本以观看新文本。在第二场景中,应用显示正如第一场景中的第一网页。然而,当用户选择向右箭头来导航到第二网页时,应用显示重复内容之后发生的一部分网页。这可以允许用户观看新内容而不用必须手动导航到新内容。在一些实施方式中,用户可以滚动或以其他方式导航直到观看到重复文本。在一些实施方式中,可以通过存储第一电子文档的内容并将该第一电子文档的内容与第二电子文档的内容进行比较来完成重复文本的縮减。例如,转码器110可以将内容存储在系统存储212中。内容可以包括文本、图像、视频、音频等。在一些实施方式中,可以从保存的内容中排除格式化信息。当请求第二电子文档时,转码器110可以比较第一和第二文档的内容。例如,转码器110可以对文本内容执行字符串比较以确定第一和第二电子文档之间的哪个文本类似或文本是否类似。如果存在重复文本,则转码器110可以在重复文本之后插入锚标签,当向用户显示第二电子文档时,所述锚标签使得移动设备104上的应用显示非重复文本。在其他实施方式中,转码器可以比较文件名、文件大小、或者诸如音频文件、视频文件或图像的媒体的一个或多个字节,以确定它们是否是重复内容。例如,如果第二电子文档中的音频文件具有与第一电子文档中的音频文件相同的文件名或文件路径,则转码器可以修改第二电子文档以使得其不播放该音频文件(例如,去除指定应当播放音频文件的HTML,或生成指令应用减弱音频文件的声音的HTML代码)。对于视频文件可以执行类似的处理。如果确定图像是重复的,则转码器可以将其从第二文档中去除或者将其重新定位,以使得当最初加载第二电子文档时不显示该图像。例如,类似于第二场景中的重复文本的位置,图像可以被重新定位于非重复内容之上。在其他实施方式中,重复内容(例如,文本、图像、视频等)可以被包括在用户界面元素中,如果用户希望观看该重复内容,则用户可以展开该用户界面元素。在另一个实施方式中,多个重复内容标识符可以被生成并插入到第二文档中。这可以允许用户通过选择导航到下一片段的非重复内容的连接来跳过重复内容。例如,非重复文本的块后面可以跟随着重复文本的块。文档生成器可以嵌入允许用户跳过重复文本的两个标签。在一些实施方式中,第一个是标识下一个非重复文本的块的锚标签,第二个是参考锚标签并且当由用户选择时导航到该标签的链接。链接可以位于非重复文本之后,以使得在读取非重复文本的块之后,用户可以选择该链接,所述链接使得应用跳过后面的重复文本的块,而跳到下一个非重复文本的块。图7是包括进度(progress)监视器的转码电子文档的例子。在一些实施方式中,电子文档可以被分段为用于在较小屏幕上显示的多个片段或者大块(chunk)。移动设备可以显示进度监视器以通知用户他或她当前观看的是哪个大块。在一些实施方式中,所述大块是从网页的顶部到底端的网页的顺序区划。例如,第一大块将是网页的最顶部部分,第二大块将是其下面的部分,等等,直到将包括网页的最底端部分的最后一个大块。在其他实施方式中,大块不是顺序的,但是可以基于电子文档指定的片段或画面。例如,登录片段可以是一个大块,法律通知是第二大块,且画面中的搜索框可以是第三大块。进度条可以包括允许用户在不同的电子文档(例如,网页)之间或单个电子文档的大块之中移动的导航元素。例如,"prev(前一个)"和"next(后一个)"导航元素使得用户能够分别导航到前一个和后一个网页。进度条中的高亮部分可以显示用户当前正在观看的是电子文档中的哪个大块。在第一截屏中,用户正在观看第一大块,而在第二截屏中,用户正在观看第二大块。如果用户希望导航到第三大块,则他可以在进度条上选择第三大块将出现的点,如在第三截屏中所示。高亮部分的长度也可以被动态更新,以反映在电子文档中有多少大块。例如,如果仅存在两个大块,则高亮部分相对于进度条的总长度来说可以非常大(例如,该部分可以占据进度条的一半)。如果存在许多大块,则高亮部分可以更小(例如,如果存在io个大块,则高亮部分可以是进度条的大小的十分之一)。在一些实施方式中,当用户在电子文档中从头到尾导航时,以固定的位置显示进度条。例如,如图7所示,进度条可以被保持在显示的底端。图8是可用于实现在该文档中描述的系统和方法的计算设备800、850的框图,计算设备800、850作为客户端或者作为服务器或多个服务器。计算设备800意欲表示各种形式的数字计算机,诸如膝上型电脑、桌上型电脑、工作站、个人数字助理、服务器、刀片服务器、大型机和其他合适的计算机。计算设备850意欲表示各种形式的移动设备,诸如个人数字助理、蜂窝电话、智能电话和其他类似的计算设备。这里所示出的组件、它们的连接和关系以及它们的功能仅仅意指示范性的,而不意指限制在本文档中描述和/或要求的发明的实现。计算设备800包括处理器802、存储器804、存储设备806、连接到存储器804和高速扩展端口810的高速接口808、以及连接到低速总线814和存储设备806的低速接口812。使用各种总线将组件802、804、806、808、810和812中的每个互连,组件802、804、806、808、810和812中的每个可以被安装在公共母板上或以其他合适的方式来安装。处理器802可以处理用于在计算设备800内执行的指令,包括存储在存储器804中或存储设备806上、用于在诸如耦接到高速接口808的显示器816的外部输入/输出设备上显示关于GUI的图形信息的指令。在其他实施方式中,当适当时,可以与多个存储器和多类存储器一起使用多个处理器和/或多个总线。同样,可以连接多个计算设备800,其中每个设备提供部分必要操作(例如,作为服务器库、一组刀片服务器或多个处理器系统)。存储器804存储计算设备800中的信息。在一个实施方式中,存储器804是易失性存储单元。在另一个实施方式中,存储器804是非易失性存储单元。存储器804也可以是另一形式的计算机可读介质,诸如磁盘或光盘。存储设备806能够为计算设备800提供大容量存储。在一个实施方式中,存储设备806可以是或包括计算机可读介质,诸如软盘设备、硬盘设备、光盘设备、或磁带设备、闪存或其他类似的固态存储设备、或者包括存储区域网络中的设备或其他配置的设备的阵列。计算机程序产品可以被有形地具体化在信息载体中。计算机程序产品也可以包括当执行时完成诸如上述描述的那些方法的一个或多个方法的指令。所述信息载体是计算机或机器可读介质,诸如存储器804、存储设备806、处理器802上的存储器或传播信号。高速控制器808管理用于计算设备800的带宽密集型(bandwidth-intensive)操作,而低速控制器812管理更低的带宽密集型操作。这样的功能分配仅仅是示范性的。在一个实施方式中,高速控制器808耦接到存储器804、显示器816(例如,通过图形处理器或加速器)和可以接受各种扩展卡(未示出)的高速扩展端口810。在实施方式中,低速控制器812耦接到存储设备806和低速扩展端口814。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)的低速扩展端口可以例如通过网络适配器而耦接一个或多个输入/输出设备,诸如键盘、指示设备、扫描仪、或者诸如交换机或路由器的网络设备。可以以多个不同的形式来实现计算设备800,如图所示。例如,其可以被实现为标准服务器820,或者更多的时间是以一组这样的服务器来实现。其也可以被实现为机架服务器系统824的一部分。此外,其可以被实现在诸如膝上型计算机822的个人计算机中。可替换地,来自计算设备800的组件可以与诸如设备850的移动设备(未示出)中的其他组件相组合。每个这样的设备可以包括计算设备800、850中的一个或多个,并且整个系统可以由彼此通信的多个计算设备800、850组成。除其它组件之外,计算设备850包括处理器852、存储器864、诸如显示器854的输入/输出设备、通信接口866和收发器868。设备850也可以具有诸如微驱动器或其他设备的存储设备,以提供额外存储。使用各种总线将组件850、852、864、854、866和868中的每个互连,并且组件中的多个可以被安装在公共母板上或以其他合适的方式来安装。处理器852可以执行计算设备850中的指令,包括存储在存储器864中的指令。处理器可以被实现为包括分离以及复合的模拟和数字处理器的芯片的芯片组。处理器可以例如提供设备850的其他组件的协同,诸如控制用户界面、设备850运行的应用和设备850的无线通信。处理器852可以通过耦接到显示器854的控制接口858和显示接口856与用户通信。显示器854可以是例如TFT(薄膜晶体管液晶显示)显示器或OLED(有机发光二极管)显示器,或者其它适当的显示技术。显示接口856可包括用于驱动显示器854以向用户呈现图形和其他信息的适当电路。控制接口858可从用户接收命令并将它们进行转换以便提交给处理器852。此外,可提供与处理器852进行通信的外部接口862,以便使得设备850能够与其它设备进行邻近区域的通信。例如,外部接口862在一些实施方式中可提供有线通信或者在其他实施方式中提供无线通信,并且可以使用多个接口。存储器864存储计算设备850内的信息。存储器864可以被实现为一个或多个计算机可读介质或媒体、易失性存储单元或非易失性存储单元。还可以提供扩展存储器874,其通过扩展接口872连接到设备850,所述扩展接口872可包括例如SI匪(单列直插存储模块)卡接口。这样的扩展存储器874可为设备850提供额外的存储空间,或者还可以为设备850存储应用或其它信息。特别地,扩展存储器874可包括执行或补充上述过程的指令,并且还可包括安全信息。因此,例如,扩展存储器874可被提供为用于设备850的安全模块,并且可利用允许安全使用设备850的指令进行编程。此外,可经由SI匪卡提供安全应用以及附加信息,诸如以无法被黑客破坏的方式在SIMM卡上提供识别信息。如以下所讨论的,所述存储器可包括例如闪存和/或NVRAM存储器。在一个实施方式中,计算机程序产品被有形地具体化在信息载体中。所述计算机程序产品包含当被执行时执行诸如如上所述那些方法的一个或多个方法的指令。信息载体是计算机或机器可读介质,诸如存储器864、扩展存储器874、处理器852上的存储器或例如通过收发器868或外部接口862可接收的传播信号。设备850可通过通信接口866进行无线通信,所述通信接口866可包括必要的数字信号处理电路。通信接口866可在各种模式或协议下提供通信,除其它之外,诸如GSM语音呼叫、SMS、EMS、或匪S消息发送、CDMA、TDMA、PDC、WCDMA、CDMA2000或GPRS。例如,这样的通信可通过射频收发器868进行。此外,可使用诸如蓝牙、WiFi或其它这样的收发器(未示出)来进行短程通信。此外,GPS(全球定位系统)接收器模块870可向设备850提供附加的导航和定位相关无线数据,其可以由在设备850上运行的应用适当使用。设备850还可以使用音频编解码器860进行可听通信,所述音频编解码器860可从用户接收话音信息并将其转换为可用的数字信息。音频编解码器860同样可以诸如通过例如处于设备850的耳机中的扬声器为用户生成可听的声音。这样的声音可包括来自语音电话呼叫的声音、可包括所记录的声音(例如,语音消息、音乐文档等)并且还可包括由在设备850上操作的应用所生成的声音。如图所示,可以以多种不同形式来实现计算设备850。例如,其可以被实现为蜂窝电话880。其还可以被实现为智能电话882、个人数字助理或其它类似移动设备的一部分。这里所描述的系统和技术的各种实施方式可以以数字电子电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合来实现。这些各种实施方式可包括一个或多个计算机程序中的实施方式,所述计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,所述可编程系统可以是专用或通用的,所述至少一个可编程处理器被耦接来从存储系统、至少一个输入设备和至少一个输出设备接收数据和指令并向其发送数据和指令。这些计算机程序(也被称作程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且能够以高级程序和/或面向对象编程语言来实现和/或以汇编/机器语言来实现。如这里所使用的,术语"机器可读介质"、"计算机可读介质"是指用来向可编程处理器提供机器指令和/或数据的任意计算机程序产品、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑设备(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语"机器可读信号"是指用来向可编程处理器提供机器指令和/或数据的任意信号。为了提供与用户的交互,这里所描述的系统和技术可被实现在具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)和用户能够通过其向计算机提供输入的键盘和指示设备(例如,鼠标或轨迹球)的计算机上。也可以使用其它类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任意形式的感15官反馈(例如,视觉反馈、听觉反馈或触觉反馈);并且可以以包括声音、语音或触觉输入的任意形式接收来自用户的输入。这里所描述的系统和技术能够被实现在包括后端组件(例如,作为数据服务器)的计算系统中、或被实现在包括中间件组件(例如,作为应用服务器)的计算系统中、或者被实现在包括前端组件(例如,具有图形用户界面或用户能够通过其与这里所描述的系统和技术的实施方式进行交互的Web浏览器的客户端计算机)的计算系统中,或者被实现在这样的后端、中间件或前端组件的任意组合中。所述系统的组件可以通过数字数据通信的任意形式或介质(例如,通信网络)进行互连。通信网络的示例包括局域网("LAN")、广域网("WAN")和因特网。计算系统可包括客户端和服务器。客户端和服务器通常彼此远离并且典型地通过通信网络进行交互。客户端和服务器的关系依靠在各个计算机上运行并且彼此具有客户端_服务器关系的计算机程序的功效所生成。虽然上面具体描述了几个实施方式,但是其他实施方式也是可以的。在一些实施方式中,可以定制特定站点的显示。当对这些站点中的一个做出请求时,转码器基于预定模版包括诸如ToC或登录标识符的元素。例如,社交网络站点可以具有定义的站点结构,诸如人物简介部分、评论部分、照片部分等。转码器可以确定该站点在定制转码的站点列表上,并且可以例如基于定义的站点结构来构造ToC。类似地,如此的定制可以被应用于登录标识符和重复内容标识符的放置。此外,在附图中描述的逻辑流不需要是所示的特定的顺序或者连续的顺序来获得所希望的结果。另外,可以提供其它步骤,或可以从描述的流中删除步骤,以及可以将其它组件添加到所描述的系统中或者从所描述的系统中移除组件。因此,其它实施方式在所附权利要求的范围内。权利要求一种处理用于在移动设备上显示的信息的计算机实现的方法,该方法包括从移动设备接收对于电子文档的请求;基于所述电子文档的格式化信息或内容来识别用于内容表(ToC)的条目;以及输出用于插入在所述电子文档中的、由所述移动设备上的应用使用以使得用户能够从所述电子文档的第一观看部分访问所述ToC的ToC标识符,所述电子文档的所述第一观看部分基本上在可用于向用户显示的所述电子文档的其他部分之前被显示。2.根据权利要求l所述的方法,其中,所述ToC标识符包括收縮形式的ToC。3.根据权利要求2所述的方法,还包括从所述用户接收对与所述ToC标识符相关的控制的第一选择,并且以展开形式显示所述ToC。4.根据权利要求3所述的方法,其中,与所述ToC标识符相关的所述控制包括可选择的加号。5.根据权利要求3所述的方法,还包括接收对与所述ToC标识符相关的控制的第二选择,并且以收縮形式显示所述ToC。6.根据权利要求1所述的方法,其中,识别用于所述ToC的条目包括识别标记文档中的格式化标签。7.根据权利要求6所述的方法,其中,所述格式化标签是从包括标题标签、字体标签、加粗标签、斜体标签和锚标签的组中选择的。8.根据权利要求1所述的方法,其中,识别用于所述ToC的条目包括识别与图像相关的文本。9.根据权利要求1所述的方法,其中,识别用于所述ToC的条目包括识别位于文本块之前的文本或定位为文本块中的第一句的文本。10.根据权利要求1所述的方法,其中,在接收对于所述电子文档的请求之后执行识别用于ToC的条目。11.根据权利要求1所述的方法,其中,所述ToC标识符包括到包含所述ToC的不同电子文档的第一链接。12.根据权利要求ll所述的方法,其中,所述不同电子文档包括使得所述用户无需选择所述ToC中的条目即可导航回包括所述ToC标识符的所述电子文档的第二链接。13.根据权利要求1所述的方法,其中,所述ToC包括一个或多个条目,其中至少一个条目包括当被用户选择时启动由所述条目标识的内容的显示的链接。14.根据权利要求1所述的方法,还包括存储具有所插入的ToC标识符的所述电子文档的副本。15.根据权利要求14所述的方法,还包括响应于对于所述电子文档的请求而发送所存储的电子文档的副本,而不是从远程web服务器检索所述电子文档。16.根据权利要求1所述的方法,还包括将所述电子文档逻辑地划分为多个片段。17.根据权利要求1所述的方法,还包括输出用于插入在所述电子文档中的、用于向用户指示哪一个片段被显示给用户的进度条。18.根据权利要求1所述的方法,还包括存储所述电子文档的第一内容;从所述移动设备接收对于第二电子文档的请求;将所述电子文档的第一内容与所述第二电子文档的第二内容进行比较,以确定所述第二内容的至少一部分是否是超过相似性阈值的重复内容;以及输出用于在所述移动设备上显示的、不再强调所述重复内容的至少一部分的修改后的第二文档。19.一种系统,包括接口,用于从移动设备接收对于电子文档的请求;解析器,用于基于所述电子文档的格式化信息或内容来识别用于内容表(ToC)的条目;以及内容表生成器,用于输出用于插入在所述电子文档中的、由所述移动设备上的应用使用以使得用户能够从所述电子文档的第一观看部分访问所述ToC的ToC标识符,所述电子文档的所述第一观看部分基本上在可用于向用户显示的所述电子文档的其他部分之前被显示。20.—种计算机实现的方法,包括在第一服务器处从客户端设备接收对于在第二服务器处托管的电子文档的请求;从所述第二服务器检索所请求的电子文档;生成用于所述电子文档的内容表(ToC),其中基于所述电子文档中的格式化信息或内容来生成所述ToC中的条目;以及与所述电子文档相关联地向所述客户端发送所述ToC,用于访问所述电子文档中的内容。全文摘要除其他以外,该说明书的主题可以被具体化在生成与客户端设备所请求的电子文档相关的内容表的方法中。该主题也可以被具体化在减少对所请求的电子文档中的样板文件的强调的方法中和操纵登录信息以使得该信息更易于被显示所请求的电子文档的客户端设备的用户访问的方法中。文档编号H04B1/40GK101765979SQ200880017069公开日2010年6月30日申请日期2008年3月31日优先权日2007年3月30日发明者亚历克斯·尼科拉乌,斯科特·杰森,杨官龙,西奥多·B·万贝莱,迈克尔·F·吕克申请人:谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1