转换表格信息以便在面积有限的显示器上表现的制作方法

文档序号:7592623阅读:80来源:国知局

专利名称::转换表格信息以便在面积有限的显示器上表现的制作方法
技术领域
:本发明涉及表现(render)表格信息(tabularinformation)的系统和方法,更具体地说,涉及预留用于转换表格信息的存储空间,以便在显示器面积有限的终端上表现的系统、方法和计算机程序产品。
背景技术
:产生诸如网页、电子邮件消息和字处理文件之类电子文档的企业和个人一般具有心目中的目标平台。该平台通常是具有适当存储容量,存储器,带宽和较大(一般至少14英寸对角线)的显示器的桌上型计算机。借助这种目标平台产生的文件通常包含复杂的格式信息,包括表格、框架、图形和导航辅助工具,所有这些格式信息定义如何表现该文档。用户可能希望能够通过最初未针对其设计文档的媒介,例如可接入因特网的移动电话机,个人数字助手(PDA)或手持式计算机,访问这样的文档。这些设备可能具有有限的显示面积,分辨率和表现能力,不能如同最初设计那样表现这种文档,或者这些设备按照极慢和/或不方便的方式表现这种文档。例如,可接入因特网的移动电话机通常只能显示几行文字,而它们表现图像的能力仅限于灰度级或拇指甲大小的图像,或者根本没有图像。显示受限的媒介的一个极端例子是语音。在这方面,诸如AT&TNaturalVoicesTMText-toSpeechEngine之类系统允许用户通过拨入使用文本-语音转换,经电话机口述文档内容的服务,借助电话访问电子文档。但是,口述必然是文本的一维“表现”,不能表达二维表格中内含的复杂布局信息。通常,当要求由于有限的屏幕尺寸、分辨率和表现能力的缘故,不能照最初设计那样表现这种文档的设备表现所述文档时,所述设备就擅自处理。在这方面,对于包括按照二维表格方式格式化的信息的文档,一些传统设备忽略这种表格。当表格过宽,不能在设备的显示区内显示时,其它设备截去一个或多个选定列。还有一些设备实现表格的机械“线性化”,单独地表现表格的每个单元格,按照预定的顺序,例如从左到右,从上到下访问表格中的单元格,通常不考虑表格内这种单元格的内容的自然排序。此外,其它设备只表现整个表格的一小部分“视见区”(viewport),要求设备的用户表示(例如通过按下方向箭)在表格内移动视见区,例如从左到右,从而暴露表格的不同部分的要求。虽然这种表现表格的技术有时满足要求,但是仍然希望设计一种改进的系统和方法,用于转换表格信息,以便按照呈现所有表格数据的方式,以及按照使查看表格中信息的用户更易于理解这种信息的方式,在面积有限的显示器上表现表格信息。
发明内容鉴于上述
背景技术
,本发明的实施例提供一种改进系统和相关的终端,方法和计算机程序产品,用于转换包括至少一个表格的表格信息。和传统技术相反,本发明的实施例能够按照对查看表格内容的用户来说,更便利、更易于理解地呈现表格内容的方式,转换表格,以便随后由显示面积有限的终端表现,例如通过把表格内的标记局部化(localize)于与相应标记相关的那些单元格。于是,和在这种终端上表现表格的传统技术相反,本发明的实施例能够在不截去这种表格的一个或多个选定列的情况下,不必在不考虑表格内单元格的内容的自然排序,通过表现表格的每个单元格,进行表格的机械线性化的情况下,以及在并不仅仅表现整个表格的一小部分视见区,从而要求设备的用户移动视见区的情况下,表现这种表格的全部内容。根据本发明的一个方面,提供一种转换表格信息,以便在显示面积有限的终端上表现表格信息的系统。该系统包括网络实体,例如移动终端,始发服务器,代理/网关,短消息服务中心(SMSC),多媒体消息服务中心(MMSC),网关GPRS服务节点(GGSN),用户处理器等。网络实体包括能够接收包括表格信息的电子文档的文档转换器,所述表格信息包括表格。在这方面,文档转换器能够根据每个表格的排序,并当至少一个表格包括至少一个标记时,还根据至少一个标记,把表格转换成表格的线性表示。更具体地说,文档转换器能够通过排列表格,以致表格均具有预定的排序,例如行优先排序或者列优先排序,来转换表格。随后,当表格包括至少一个标记时,文档转换器能够局部化每个标记,之后,根据排列成具有预定排序的表格,并当表格包括至少一个标记时,还根据每个局部化标记,使表格线性化。文档转换器能够确定终端是否支持拍全景(panning)。如果终端支持拍全景,则文档转换器能够接收或者转换表格,或者在不转换表格的情况下,转发电子文档,例如转发给终端的选择。之后,当所述选择包括转换表格时,文档转换器能够转换表格。可以理解,每个表格能够,并且通常确实包括按照至少一行和至少一列组织的许多单元格。于是,文档转换器能够通过识别表格的自然排序,并且当表格具有不同于预定排序的自然排序时,排列具有不同于预定排序的自然排序的表格,以致相应表格具有预定排序,来排列表格。文档转换器能够按照许多不同方式确定自然排序。例如,文档转换器能够确定表格的每个单元格的特征矢量,根据相应单元格的特征矢量,确定相邻单元格之间的距离。之后,文档转换器能够确定表格的同一行中各对相邻单元格之间的平均距离,和表格的同一列中各对相邻单元格之间的平均距离。然后,文档转换器能够根据平均距离,识别表格的自然排序。同样,文档转换器能够按照许多不同方式,局部化每个表格内的标记。例如,文档转换器能够识别一个或多个跨越标记和/或一个或多个直接标记。可以理解,每个跨越标记与表格的许多列和行相关,每个直接标记和表格的一列或一行相关。在识别跨越标记或直接标记之后,文档转换器能够确定与一个跨越标记和/或一个直接标记相关的表格的每个单元格的标记串,从而相对于标记涉及的表格的单元格,局部化每个跨越标记和每个直接标记,每个标记串至少包括跨越标记和直接标记之一。根据表格的相邻行或相邻列之间的相似性的量度,文档转换器能够识别直接标记。例如,文档转换器能够确定每对相邻行或相邻列之间的相似性的量度。例如,文档转换器能够通过确定每对相邻行或列的每个单元格的特征矢量,并根据相应单元格的特征矢量,分别确定同一列或行中单元格之间的距离,确定相似性的量度。之后,文档转换器能够计算跨越相邻行的各列或相邻列的各行的距离之和,从而分别确定相邻行或列之间的相似性的量度。然后,在确定相似性的量度之后,根据相似性的量度,文档转换器能够识别和其它对相邻行或列相比,不相似性大于指定百分率的一对相邻行或列。之后,文档转换器能够分别把识别的一对相邻行或列的一行或一列识别为包括至少一个直接标记。根据本发明的另一方面,提供转换包括至少一个表格的表格信息的终端,方法和计算机程序产品。于是,本发明的实施例提供转换包括至少一个表格的表格信息的系统和相关终端,方法及计算机程序产品。本发明实施例的系统和相关终端,方法以及计算机程序产品能够转换表格,以便随后由终端,例如移动电话表现所述表格信息。和传统的方法相反,本发明的系统和相关终端,方法以及计算机程序产品能够按照使终端能够呈现表格的全部内容的方式转换表格。另外,本发明的系统和相关终端,方法以及计算机程序产品能够把表格内的标记局部化于与相应标记联系的那些单元格,从而能够按照和表格的原始设计更一致的方式表现表格。于是,本发明的实施例的系统和相关终端,方法以及计算机程序产品克服了现有技术的问题,并且提供了其它优点。在概括说明本发明之后,现在参见附图,所述附图不必按比例绘制,其中图1是根据本发明一个实施例的无线通信系统的示意方框图,包括终端通过无线RF链路与之双向耦接的蜂窝网络和数据网络;图2是根据本发明的实施例,能够起终端,始发服务器,代理/网关,SMSC,MMSC,GGSN,和/或用户处理器作用的实体的示意方框图;图3是根据本发明的实施例,可起终端作用的移动站的示意方框图;图4是根据本发明的一个实施例,下载或以其它方式接收包括表格的电子文档的终端的功能方框图;图5是根据本发明的一个实施例,图解说明转换电子文档中的表格信息的方法的各个步骤的流程图;图6是根据本发明的一个实施例,包括数据的电子文档的树形数据结构表示的方框图;图7A是根据本发明的一个实施例,包括隐含表格的电子文档的树形数据结构表示的方框图;图7B是根据本发明的一个实施例,在隐含表格被再形成为显式表格的情况下,图7A的树形数据结构的方框图;图8A根据本发明的一个实施例,图解说明了包含在电子文档内的表格;图8B是根据本发明的一个实施例,图8A的表格的方框图,包括表格的单元格的特征矢量,以及单元格之间的相似性量度;图9根据本发明的一个实施例,图解说明了包含在电子文档内的另一表格;图10A和10B是图解说明在终端显示器上表现的图9的表格的各个部分的示意方框图,其中所述表格被线性化,而没有局部化表格的标记;图11是根据本发明的一个实施例,图解说明包含在电子文档内表格的标记的局部化方法的各个步骤的流程图;图12是根据本发明的一个实施例,可包含在电子文档内的表格的标记树表示法的方框图;图13A-13C是根据本发明的一个实施例,包含表格的电子文档的树形数据结构表示的方框图,其中表格被线性化;图14根据本发明的一个实施例,图解说明了图9的表格的线性化表示;图15是根据本发明的一个实施例,图解说明在终端显示器上表现的图9的表格的一部分的示意方框图,其中表格已被转换。具体实施例方式下面参考附图,更详细地说明本发明,附图中表示了本发明的优选实施例。但是,可按照不同的形式体现本发明,本发明不应被认作局限于其中陈述的实施例;相反,提供这些实施例是便于本公开内容彻底和完整,并向本领域的技术人员充分传达本发明的范围。附图中,相同的附图标记代表相同的部件。参见图1,图1提供了受益于本发明的一种终端和系统。将主要结合移动通信应用,说明本发明实施例的系统、终端、方法和计算机程序产品。但是,应明白在移动通信行业中以及在移动通信行业外,都可结合各种其它应用,利用本发明实施例的系统、终端、方法和计算机程序产品。例如,可结合有线和/或无线网络(例如因特网)应用,利用本发明实施例的系统、终端、方法和计算机程序产品。如图所示,终端10可包括相对于基站(BS)14收发信号的天线12。基站是包括操纵网络所需的部件,例如移动交换中心(MSC)16的蜂窝网络的一部分。本领域的技术人员众所周知,蜂窝网络也可被称为基站/MSC/协作功能(BMI)。操作上,当终端发出和接收呼叫时,MSC能够路由往来于终端的呼叫。当终端与某一呼叫有关时,MSC还可提供与陆线干线的连接。另外,MSC能够控制往来于终端的消息的转发,还能够控制往来于消息接发中心的关于终端的消息,例如往来于SMS中心(SMSC)17的短消息服务(SMS)消息的转发。MSC16可与诸如局域网(LAN)、城域网(MAN)和/或广域网(WAN)之类数据网络耦接。MSC可以直接与数据网连接。可是,在一个典型实施例中,MSC与代理18,网关(GTW)等等耦接,代理与诸如互联网20之类WAN连接。例如,MSC可和与互联网连接的无线应用协议(WAP)GTW连接。诸如处理部件(例如个人计算机,服务器计算机等)之类设备又可经由互联网与终端10连接。例如,如下面所述,处理部件可包括一个或多个与始发服务器22等相联系的处理部件,图1中图解说明了始发服务器22等的其中之一。BS14也可与信令GPRS(通用分组无线服务)支持节点(SGSN)24连接。本领域的技术人员已知,对于分组交换服务来说,SGSN一般能够实现类似于MSC16的功能。类似于MSC,SGSN可与诸如因特网20之类数据网络连接。SGSN可直接与数据网络连接。但是,在一个更典型的实施例中,SGSN与分组交换核心网络,例如GPRS核心网络26连接。分组交换核心网络再与另一GTW耦接,例如GTWGPRS支持节点(GGSN)28连接,GGSN与因特网连接。另外,GGSN可与消息接发中心,例如多媒体消息接发服务(MMS)中心30连接。在这方面,类似于MSC,GGSN和SGSN能够控制消息,例如MMS消息的转发。GGSN和SGSN还能够控制往来于消息接发中心的关于终端的消息的转发。另外,通过使SGSN与GPRS核心网络26和GGSN28连接,诸如始发服务器22之类设备可通过因特网20、SGSN和GGSN与终端20连接。在这方面,诸如始发服务器之类设备可通过SGSN、GPRS和GGSN与终端通信。例如,始发服务器可根据例如多媒体广播组播服务(MBMS),向终端提供内容。有关MBMS的更多信息,参见第三代伙伴计划(3GPP)技术规范3GPPTS22.146,题为MultimediaBroadcastMulticastService(MBMS),其内容作为参考整体包含于此。终端10还可与一个或多个无线接入点(AP)32连接。AP可包括配置成根据各种技术,例如射频(RT),蓝牙(BT),红外(IrDA)或者包括WLAN技术的许多不同无线组网技术中的任意一种,与终端通信的接入点。另一方面,终端可与一个或多个用户处理器34连接。每个用户处理器可包括诸如个人计算机,膝上型计算机之类的计算系统。在这方面,用户处理器可被配置成根据各种技术,例如RF,BT,IrDA或包括LAN和/或WLAN技术的许多不同有线或无线通信技术中的任意一种,与终端通信。另外,一个或多个用户处理器可包括能够保存内容的可折卸存储器,所述内容随后可被传送给终端。AP32和用户处理器34可与因特网20连接。类似于MSC16,AP和用户处理器可直接与因特网连接。但是,在一个优选实施例中,AP经过代理18间接与因特网连接。可以理解,通过直接或间接地把终端和始发服务器22,以及许多其它设备中的任意设备与因特网连接,终端能够相互通信,与始发服务器等通信,从而实现终端的各种功能,例如向始发服务器传送数据、内容等,和/或从始发服务器接收内容、数据等。这里使用的术语“数据”、“内容”、“信息”和类似术语可被用于可交换地涉及根据本发明的实施例,能够被传送、接收和/或保存的数据。从而,这些术语的使用不应被认为对本发明的精神和范围的限制。现在参见图2,根据本发明的一个实施例,表示了网络实体,例如能够起终端10、始发服务器22代理18、SMSC17、MMSC30、GGSN28和/或用户处理器34作用的网络实体的方框图。虽然表示成独立的实体,但是在一些实施例中,一个或多个实体可支持逻辑分离但是共同位于实体内的终端、代理、始发服务器和/或用户处理器中的一个或多个。例如,单个实体可支持逻辑分离,但是位于同一地点的终端和代理。另外,例如,单个实体可支持逻辑分离,但是位于同一地点的始发服务器和用户处理器。如图所示,网络实体一般可包括与存储器38连接的处理器36。处理器还可与至少一个接口40或其它装置连接,以便传送和/或接收数据,内容等。存储器可包括易失性和/或非易失性存储器,通常保存内容、数据等。例如,存储器通常为处理器保存应用软件、指令等,以便执行根据本发明的实施例,与实体的操作相关的步骤。另外,如下所述,存储器可保存文档转换器,所述文档转换器能够转换表格信息,供终端10表现。另外,存储器可保存从网络实体传送的,或者由网络实体接收的,例如来自另一网络实体的内容。图3根据本发明的实施例,图解说明了可起终端10作用的移动站的功能图。应明白图解说明和下面描述的移动站只是可受益于本发明的一种终端的举例说明,于是不应被认为是对本发明范围的限制。虽然出于举例的目的,图解说明并且下面描述了移动站的几个实施例,但是其它类型的移动站,例如便携式数字助手(PDA),寻呼机,膝上型计算机和其它类型的语音和文本通信系统能够容易地采用本发明。移动站包括发射器42、接收器44和分别向发射器提供信号和从接收器接收信号的处理器,例如控制器46。这些信号包括根据适用的蜂窝系统的空中接口标准的信令信息,以及用户语音和/或用户产生的数据。在这方面,移动站能够按照一种或多个空气接口标准,通信协议,调制类型和接入类型工作。更具体地说,移动站能够根据许多第一代(1G)、第二代(2G)、2.5G和/或第三代(3G)通信协议等中的任意一种通信协议工作。例如,移动站能够按照2G无线通信协议IS-136(TDMA)、GSM和IS-95(CDMA)工作。另外,移动站能够按照2.5G无线通信协议GPRS、增强数据GSM环境(EDGE)等工作。另外,移动站能够按照许多不同数字广播技术中的任意一种,例如DVB技术(例如DVB-T,ETSI标准EN300744)工作。移动站还能够按照许多不同的广播和/或组播技术中的任意一种,例如MBMS技术(例如3GPPTS22.146)工作。此外,移动站能够按照ISDB-T、DAB、ATSC技术等工作。一些窄带AMPS(NAMPS)以及TACS,移动站也受益于本发明的实施例,双模式或更高模式移动站(例如数字/模拟或TDMA/CDMA/模拟电话机)也应受益于本发明的实施例。控制器46显然包括实现移动站的音频和逻辑功能所需的电路。例如,控制器可由数据信号处理装置,微处理器,各种模/数转换器,数/模转换器和其它支持电路组成。根据这些装置的能力,在这些装置之间分配移动站的控制和信号处理功能。从而,控制器还包括在调制和传输之前,对消息和数据进行卷积编码和交错的功能。控制器还可包括内部语音编码器(VC)46A,并且可包括内容数据调制解调器(DM)46B。此外,控制器可包括操作保存在存储器中的一个或多个应用软件的功能。移动站还包括用户接口,包括传统的耳机或扬声器48,振铃器50,麦克风52,显示器54,和用户输入接口,所有这些都与控制器46连接。允许移动站接收数据的用户输入接口可包括允许移动站接收数据的许多设备中的任意一种,例如小键盘56,触摸显示器(未示出)或其它输入装置。在包括小键盘的实施例中,小键盘包括传统的数字(0-9)和相关按键(#,*),以及用于操作移动站的其它按键。根据许多不同的有线和/或无线技术中的任意一种技术,移动站还可包括共享数据和/或从电子设备,例如另一终端10,代理18,始发服务器22,AP32,用户处理器24等获得数据的一个或多个装置。例如,移动站台可包括射频(RF)收发器58和/或红外线(IR)收发器60,从而移动站能够根据射频和/或红外线技术共享和/或获得数据。另外例如,移动站可包括蓝牙(BT)收发器62,从而移动站能够根据蓝牙传送技术共享和/或获得数据。另一方面,虽然未示出,但是移动站可根据许多不同的有线和/或无线组网技术,包括LAN和/或WLAN技术,传送和/或从电子设备接收数据。移动站还可包括存储器,例如用户身份识别模块(SIM)64,可移动的用户身份识别模块(R-UIM)等,所述存储器通常保存与移动用户相关的信息单元。除SIM之外,移动站可包括其它存储器。在这方面,移动站可包括可嵌入的和/或可折卸的易失性存储器66和/或其它非易失性存储器68。例如,其它非易失性存储器可包括含嵌入的或可移动多媒体存储卡(MMC’s),记忆棒,EEPROM,闪存,硬盘等。存储器64,66,68能保存移动站用于实现移动站的功能的许多条信息中的任意信息,以及数据。例如,存储器可存储能够向例如MSC16唯一地识别移动站的标识符,例如国际移动设备识别(IMEI)码,国际移动用户识别(IMSI)码,移动站综合业务数字网(MSISDN)码等。存储器还能保存内容,例如从始发服务器22和/或用户处理器34收到的内容。另外,例如,存储器能保存一个或多个显现应用程序,例如传统的文本阅读器,音频播放器,视频播放器,多媒体浏览器等。另外,如下所述,存储器可保存能够转换表格信息,以便由移动站表现的文档转换器。如在
背景技术
中所述,由于有限的显示面积,分辨率和表现能力的缘故,终端10一般不能如同最初设计电子文档那样表现电子文档。例如,许多终端一般只能在显示器(如显示器54)上表现几行文本,或者灰度级,拇指甲大小的图像或根本没有图像。在这方面,终端通常不能如同最初设计表格信息那样,表现电子文档的表格信息。例如,一些传统的设备忽略这种列表信息。其它设备截去表格的选定列,或者执行表格的线性化,单独地表现表格的每个单元格,一般不考虑表格中这些单元格的内容的自然排序。其它一些设备只表现整个表格的一小部分视见区,要求设备的用户在表格内移动视见区,例如从左向右,从而显示表格的不同部分。于是,本发明的实施例能够通过转换电子文档,以便由具有有限显示面积,分辨率和/或表现能力的显示器的终端表现。更具体地说,本发明的实施例能够转换电子文档的表格信息,以便由这种终端表现。和在这种终端上表现表格的传统技术相反,于是,本发明的实施例能够在不截去这种表格的一个或多个选定列,通过表现表格的每个单元格,进行表格的机械线性化,而不考虑表格内单元格的内容的自然排序,以及并不仅仅表现整个表格的一小部分视见区,从而要求设备的用户移动视见区的情况下,表现这种表格的全部内容。根据本发明的实施例,电子文档的表格信息一般包括一个或多个表格,每个表格封闭内容,例如数据、信息等的一个二维矩阵。如同本领域的技术人员所理解那样,这种二维表格通常包括至少一行和至少一列。另外,这种表格可(但是一般并不)包括复杂结构(例如,嵌套表格或图像)。另外,在这种表格的行和列之间一般存在高级的语法(syntactic)和语义(semantic)相关性。现在参见图4和5,图4和5根据本发明的一个实施例,分别图解说明了代理18的功能方框图,和转换电子文档中的表格信息的方法的流程图。更具体地说,图4根据本发明的一个优选实施例,图解说明了从内容源100,例如终端10,始发服务器22,SMSC17,MMSC30,GGSN28,用户处理器34等接收,并且随后转发电子文档的代理的功能方块图。但是,在转发电子文档之前,代理能够操作文档转换器102,文档转换器能够接收电子文档,之后转换电子文档的表格信息,以便由终端10表现。代理随后可把包括转换后的表格信息的电子文档转发给终端,以便由终端,或者更具体地说由终端的显示器(例如显示器56)表现。虽然,代理18如同这里表示和说明的那样操作文档转换器102,但是显然可从系统内的许多不同网络实体中的任意网络实体,例如包括终端10本身或内容源100操作文档转换器。在这方面,可在单一网络实体上实现文档转换器,或者文档转换器的多个部分可在一个以上的网络实体上实现。另外,如这里所述,网络转换器一般包括能够被保存在存储器(例如存储器38)内,并由处理器(例如处理器36)操作的软件。但是,另一方面,在不脱离本发明的精神和范围的情况下,文档转换器显然能够包括固件或硬件。另外,除了转换表格,以便终端表现电子文档之外,文档转换器显然能够对电子文档进行其它操作。有关各种这种操作的更多信息,例如参见,美国专利申请No.09/851404,题为ReorganizingContentofanElectronicDocument(申请日2001年5月8日),并于2003年3月6日公开为美国专利申请No.2003/0046318,其内容整体作为参考包含于此。如图5的方框104中所示,转换包含至少一个表格的表格信息的方法包括文档转换器102从内容源100接收电子文档。根据本发明的实施例,电子文档包括一个或多个表格,每个表格包括至少一行内容和至少一列内容。电子文档可具有许多不同格式中的任意一种格式。例如,电子文档可包含超文本传送协议(HTTP)文档,电子邮件文档,可移植文档格式(PDF)文档,附录(postscript)文档,ASCII文本格式(TXT)文档,可扩展置标语言(XML)文档,MicrosoftwordTM(DOC)文档,MicrosoftExceITM(XLS)文档等。收到电子文档之后,文档转换器102可把电子文档转换成个电子文档的中间数据结构表示,如方框106中所示。文档转换器可按照许多不同方式中的任意一种方式,转换电子文档,从而产生能够代表电子文档的许多不同中间数据结构中的任意一种。在这方面,文档转换器能够把电子文档转换成包含电子文档的基于常见内部树的表示的中间数据结构。例如,文档转换器可把电子文档转换成电子文档的可扩展超文本置标语言(XHTML)文档目标模型(DOM)表示。文档转换器102可按照许多不同方式把电子文档转换成XHTMLDOX数据结构。例如,在一个实施例中,数据转换器通过把电子文档转换成HTML文档(如果还不是HTML文档),把该HTML文档转换成XHTML文档,之后把该XHTML文档转换成XHTMLDOM数据结构,转换电子文档。为了把电子文档转换成前述格式,以产生XHTMLDOM数据结构,文档转换器能够执行已知的许多不同转化例程中的任意一种。另一方面,文档转换器102能够与在代理18或另一网络实体上运行的另一软件,硬件或固件模块通信,这里所述另一模块能够执行一个或多个转化例程,帮助文档转换器把电子文档转化成XHTMLDOM数据结构。例如,文档转换器能够与在wvWare项目下开发的wvWare软件包通信,把DOC文档转换成HTML文档。另外例如,文档转换器能够与在Chicago项目下开发的xlHTML软件包通信,把XLS文档转换成HTML文档。另外例如,文档转换器能够与在Tidy项目下开发的HTMLTidy软件包通信,把HTML文档转换成XHTML文档。此外例如,文档转换器102能够与XML解析器,例如XercesXML解析器软件包(在ApacheXML项目下开发)通信,把XHTML文档转换成XHTMLDOM数据结构。不论文档转换器如何把电子文档转换成代表电子文档的数据结构,数据结构可以(但是不必)被存储在和非易失性存储器相反的易失性存储器中,文档转换器和电子文档通常驻留于非易失性存储器中。如同理解的那样,数据结构通常包括和转换后XHTML文档的标签对应的许多节点,所述转换后XHTML文档的标签可基于原始HTML文档的标签。例如,考虑HTML文档的下述源代码<html><body><imgsrc=”http//www.domain.com/img/image.gif”/><table><tr><td>Thisisthefirstcell</td><td><imgsrc=”http//www.domain.com/img/image2.gif”/></td><td>Thisisthethirdcell</td></tr><tr><td>Thisisthefourthcell</td><td><imgsrc=”http//www.domain.com/img/image3.gif”/></td><td>Thisisthesixthcell</td></tr></table><small>Atextblock</small></body></html>如上述源代码所示,HTML文档包括一个包含两行三列的表格,其中每行的第二列包括一个图像。HTML文档还包括第三图像和一个小字体的文本块。从这样的HTML文档,文档转换器能够产生如图6中所示的XHTMLDOM数据结构。不论文档转换器102如何把电子文档转换成电子文档的中间数据结构表示,当文档转换器把电子文档转换成中间数据结构时或之后,文档转换器能够识别中间数据结构内的任意“隐含”表格,如图5的方框108中所示。可以理解,对于在电子文档的格式化中以其它方式,例如由HTML文档中的标签(即“<table></table>”)识别的表格,文档转换器通常不需具体识别这种表格。但是,对于其他表格,电子文档可被设计成以表格形式表现该信息,而不是包括把这种信息指定为一个表格的格式化。文档转换器能够识别这样的“隐含”表格,其中隐含表格通常不由在文档转换器把电子文档转换成数据结构之后,数据结构中的表格节点来表示。之后,文档转换器能够再形成数据结构,以包括这种表格的表格节点。例如,考虑TXT文档内的下述ASCII格式文本活动卡路里/小时有氧运动660篮球550跑步925网球450视觉上,上述ASCII格式文本明显代表一个表格。但是,该TXT格式并不包含明确表示这种文本是表格的机制(例如标签)。根据文档转换器采用的把这种TXT文档转换成数据结构的技术,文档转换器可把这样的文本块看作表格。但是,在各种其他情况下,文档转换器102可能不把这种文本块看作表格。在这些情况下,文档能够产生如图7A所示的数据结构。如图7A所示,数据结构把该文本识别成一块非结构化文本。从而,在电子文档包括在电子文档的转换过程中,不被文档转换器识别的隐含表格,或者表示成数据结构中的表格节点的隐含表格的情况下,文档转换器也能识别隐含表格。文档转换器102能够按照已知的许多不同方式(包括专用解析器和自动学习技术)中的任意一种方式,识别隐含表格。例如识别隐含表格的许多已知技术,参见JiangyingHu等的ASystemofUnderstandingandReformulatingTables,FourthICPRWORKSHOPONDOCUMENTANALYSISSYSTEM(2000);MathewHurst&ShonaDouglas,LayoutandLanguagePreliminaryInvestigationsinRecognizingtheStructureofTables,PROCEEDINGSOFTHEINTERNATIONALCONFERENCEONDOCUMENTANALYSISANDRECOGNITION(ICDAR)1043-1047(1997);以及HweeTouNg等的LearningtoRecognizeTablesinFreeText,Proceedingsofthe37thAnnualMeetingofACL443-450(1999),所述这些文献的内容作为参考整体包含于此。不论文档转换器102如何识别隐含表格,如果文档转换器识别电子文档中的一个或多个隐含表格,则文档转换器能产生或再形成把文本识别成表格的数据结构。例如,文档转换器能把一个文本块识别成表格,并在把电子文档转换成HTML文档过程中,产生被格式化,以便把文本块识别成表格的HTML文档,例如通过把文本块封闭在适当的HTML标签(例如<table>,<tr>,<td>等)中。继续上面的关于TXT文档中的文本块的例子,文档转换器能把该文本块识别成隐含表格,随后产生或再形成数据结构,以便以如图7B中所示的显式表格的形式包括所述隐含表格。在文档转换器102产生电子文档的数据结构表示之后,包括作为显式表格的任意隐含表格的再形成,文档转换器能重新排列电子文档的表格,以便具有预定排序,如方框110中所示。在这方面,无论主要按行排序还是主要按列排序,文档转换器都能识别电子文档的表格中,单元格的自然排序。如同本领域的技术人员理解的那样,当表格中的内容按行排列时,表格通常具有行优先排序。相反,当表格中的内容按列排列时,表格通常具有列优先排序。在识别电子文档的表格中的单元格的自然排序之后,文档转换器102能够重新排列该表格,从而所有表格都具有预定排序。例如,在一个典型实施例中,文档转换器能重新排列表格,以致所有表格都具有行优先排序。在这些情况下,对于那些具有列优先排序的表格来说,文档转换器能够转置表格,以致自然排序变成行优先。但是,另一方面,显然文档转换器能够重新排列表格,以致表格具有列优先排序,同时据此调整文档转换器的其它操作。文档转换器102能够按照许多不同方式中的任意一种,识别表格的自然排序。例如,文档转换器能够被配置成搜索每个表格中相邻单元格间的相似性模式。在这方面,例如考虑一个列优先表格,所述列优先表格具有在每个单元格中包括一个图像的第二行。这一行中的所有单元格彼此相似的事实表明(一般如此,但是并不总是如此)该表格具有列优先排序。另一方面,例如,考虑一个行优先表格,所述行优先表格具有在每个单元格中包含一个图像的第二列,以及包括每列中跟随有%的数字的第五列。列中的单元格彼此相似的事实同样(但不是绝对地)表明该表具有行优先排序。在一个典型实施例中,文档转换器102通过把每个单元格中的信息表示成一个特征向量,识别表格的自然排序。例如,每个单元格可由指定长度N的特征二进制矢量表示,矢量中的每个位置对应于代表相应单元格中信息的特征的判定值(是/否问题)。可以理解,特征矢量表示法是一种对表格的每个单元格的结构特征编码的方法。从而,看上去相似的单元格通常具有相似的特征矢量表示。特征向量可包括对应于许多不同判定中任意判定的许多(N)二进制位中的任意二进制位。例如,特征矢量可包括13个二进制位(即N=13),每个二进制位对应于如下所示的判定位1为“1”,当且仅当单元格包含一个图像位2为“1”,当且仅当单元格包含一个数字位3为“1”,当且仅当单元格包含一个超链接位4为“1”,当且仅当单元格包含粗体文本位5为“1”,当且仅当单元格包含斜体文本位6为“1”,当且仅当单元格包含标点符号位7为“1”,当且仅当单元格包含0到5个字符位8为“1”,当且仅当单元格包含6到10个字符位9为“1”,当且仅当单元格包含11到15个字符位10为“1”,当且仅当单元格包含16到20个字符位11为“1”,当且仅当单元格包含21到25个字符位12为“1”,当且仅当单元格包含26到30个字符位13为“1”,当且仅当单元格包含31个以上的字符现在简要参考图8A和8B,图8A和8B分别举例说明了表格,和该表格的单元格的特征矢量。如图所示,对于这种表格来说,例如,第一行、第一列的单元格包括一个空格。这样,第一行、第一列中的单元格可由特征矢量0000001000000表示,其中唯一的“1”位值对应于包括0至5个字符的单元格。相反,第二行、第一列中的单元格包括短语“equityreserveSMline”,该短语可以由特征矢量0000001000000表示。可以看出,前面的唯一“1”位值对应于包括21至25个字符的单元格(该短语包括21个字符(包含空格在内))。在把每个单元格中的信息表示成特征矢量之后,根据特征矢量,文档转换器102能够确定表格中的单元格之间的相似性。文档转换器能够按照许多不同方式,例如通过确定相邻单元格之间的“Manhattan”距离,确定相邻单元格之间的相似性值。在这方面,通过确定相应单元格的特征矢量之间不同的二进制位的数目,可确定两个相邻单元格的距离。例如,0111与1110之间的距离为2。从而可以理解,相邻单元格之间的距离越小,则相应单元格就越相似。对于根据本发明的实施例确定的图8A的表格的单元格之间的距离量度,参同图8B。此外可以理解,在各种情况下,对应于特征矢量的相应二进制位值的一个或多个判定能够比其它判定,更多地表示出单元格相似性。例如,上述13位特征矢量中的第一位可比第10位更多地表示出单元格相似性。从而,根据本发明的实施例,一个或多个二进制位可具有相关的权重,从而当相邻单元格之间,各自的二进制位不同时,在总和中,两个特征矢量之间的距离包括相关权重。不论如何确切地确定表格的相邻单元格之间的相似性量度,或距离,在确定距离之后,文档转换器102能够确定表格是具有行优先排序还是具有列优先排序。更具体地说,文档转换器能够根据表格的各行和各列间的距离,确定表格的排序。例如,文档转换器能够确定在表格中同一行中的多对相邻单元格之间的平均距离SH;和确定在表格中同一列中的多对相邻单元格间的平均距离SV。可以理解,同一行中相邻单元格之间较小的平均距离通常表示表格的各行包括相似的单元格,这暗示表格可能具有列优先排序。相反,同一列中相邻单元格之间较小的平均距离通常表示表格的各列包括相似的单元格,这暗示表格可能具有行优先排序。那么,用符号来表示,文档转换器可根据以下公式确定SH和SVSH=1R*(c-1)Σi=1RΣj=1C-1Δc(xi,j,xi,j+1)---(1)]]>SV=1(R-1)*CΣi=1R-1Σj=1CΔc(xi,j,xi+1,j)---(2)]]>如上述公式(1)和(2)中所示,i=1,...,R表示表格中的各行;j=1,...,C表示各列。xi,j和xi+1,j代表表格的相邻单元格,Δc代表相应相邻单元格之间的距离。对于图8A的表格来说,并根据图8B中所示的距离,则SH=2.4(即24/10)和SV=0.583(即7/12)。一旦文档转换器102确定了同一行和同一列中多对相邻单元格之间的平均距离SH和列SV,文档转换器就能确定表格是具有行优先排序还是列优先排序。例如,文档转换器能够通过比较平均距离来确定排序。如果同一列中多对相邻单元格之间的平均距离SV大于同一行中多对相邻单元格之间的平均距离SH(即SV>SH),则文档转换器能够确定表格具有列优先排序,否则表格具有行优先排序。为了重新排列电子文档的表格,以便具有预定排序,例如行优先排序,文档转换器随后能够转置具有列优先排序的表格,从而所有的表格都具有行优先排序。用符号来表示,通过重新组织DOM树,以致每个单元格xi,j与每个单元格xj,i交换,可转置电子文档的表格。可以理解,在各种情况下,SH和SV可能非常相似,这可导致被转置成排序和所期待的排序相反的表格。因而,在比较过程中,文档转换器102能够对SH或SV加权,从而文档转换器更可能或者不太可能转置指定的表格。例如,文档转换器可把SH乘以偏差值C,所述偏差值等于或大于1。然后,在比较SH和SV(即SV>C*SH)的过程中,随着偏差值增大,当文档转换器转置列优先表格,并且SH和SV具有相似值时,文档转换器变得不太可能转置表格。在重新排列表格,以具有预定排序之后,文档转换器102能够把表格线性化成表格的单元格的内容的一维序列,这里线性化内容并不包含在表格中。但是,有利的是,在线性化表格之前,文档转换器能够局部化包括在表格内的任意标记,如图5的方框112中所示。可以理解,许多表格包括作为一个或多个其它单元格的标记的单元格。在这方面,当标记涉及单行或单列单元时,该标记通常被称为“直接”标记。相反,当标记涉及一个以上的行或列时,该标记通常被称为“跨越”标记。例如,如图9的表格中所示,诸如“YR”,“TM”,“GP”和“G”之类标记构成直接标记,而标记“RegularSeason”和“PostSeason”构成跨越标记。可以理解,对如图9所示的具有列标记的行优先表格线性化会导致列标记与这种标记所涉及的单元格分离。这样,在显示面积有限的终端10上,难以理解表现的表格。在这方面,参见图10A和10B,图10A和10B说明了终端显示器上,图9的表格的多个部分,这里表格已经过直接线性化处理。可以看到,行标记与这些标记涉及的单元格分开,从而造成表格难以理解。更具体地说,如图所示,包括许多直接标记(例如“YR”,“TM”,“GP”,“G”等)的行视觉上和其所涉及的数据分开,即相应各列中的单元格在相应标记之下。为了避免隔离列标记和这些标记涉及的数据,一个优选实施例的文档转换器102局部化位于电子文档的表格内的标记(如果有的话)。更具体地说,文档转换器重排列标记,以致标记被置于这些标记描述的数据附近。这样,文档转换器能够帮助用户理解随后表现的表格。文档转换器102能够按照许多不同方式中的任意一种方式,局部化(localize)电子文档的表格内的标记。下面参考图11,说明局部化标记的一种特别有利的技术。如下所述,文档转换器局部化具有至少一行的行优先表格的标记,所述至少一行包括至少一个标记。但是,文档转换器显然能够在其它许多情形下局部化标记。例如,文档转换器能够局部化具有至少一列的列优先表格的标记,所述至少一列包括至少一个标记。在这种情况下,可如同这里描述那样进行局部化标记的过程,通常基于列进行基于行的操作,反之亦然。也应明白文档转换器不需局部化表格中的标记,特别是对那些不包含任何标记的表格。通常,当文档转换把表格器重排列成行优先表格,并且表格不包括具有标记的任意行时,文档转换器也不局部化标记。根据一种技术,通过首先识别包含跨越标记,即跨越一列以上的标记的各行,文档转换器102能够局部化标记,如图11的方框118中所示。更具体地说,文档转换器能够关于识别包括表格数据(例如<td>)或表头(例如<th>)的单元格的标签,检查预定行数(例如三行)的单元格,这里单元格还具有多列属性(例如“colspan”)。可以理解,这种属性通常表示跨越表格一列以上的单元格。例如,在图9的表格中,第一行包括均跨越一列以上的两个单元格(即“RegularSeason”和“PostSeason”)。在识别包括跨越标记的行之后,文档转换器102能够识别包括直接标记,即均只涉及一列的标记的任意行,如方框120中所示。与前面相似,文档转换器能够关于任意直接标记,检测预定行数(例如三行)的单元格。文档转换器能够按照许多不同方式中的任意一种方式定位直接标记。例如,在一个实施例中,文档转换器根据相邻行之间的相似性量度(例如距离)定位直接标记,其中相邻行之间的相似性量度以相邻行的单元格之间的相似性量度为基础,如上所述。在这方面,本领域的技术人员会理解,直接列标记的一行通常在许多不同方面,不同于表格中的其余各行。例如,图9的由直接列标记组成的第二行全部由字线组成,而在第二行之下的各行几乎全部由数字组成。为了定位表格的直接标记,文档转换器102能够确定表格的相邻行之间的相似性或距离,这里根据相应各行内垂直相邻单元格的相似性来确定相似性。用符号来表示,文档转换器能够根据下面等式(3),确定表格的相邻行之间的距离ΔRΔR(i,i+1)=Σj=1cΔc(xi,j,xi+1,j),i=m,...,R---(3)]]>上面,m表示表格的不包含至少一个跨越标记的第一行。在确定相邻行之间的距离后,文档转换器102能够识别和任意一对后续相邻行相比,不相似性明显较大的任意一对相邻行,这里明显不相似性表示出包括直接标记的相应一对相邻行中的第一行。换句话说,文档转换器能够确定任意一对相邻行之间的距离是否明显大于后续任意一对相邻行之间的距离,随后把任意一对这种相邻行的第一行识别为包括直接标记。更具体地说,例如,文档转换器能够比较每个ΔR(i,i+1)和始于ΔR(i+1,i+2)的后续各对相邻行之间的距离。之后,对于至少比后续任意一对相邻行大指定百分比(例如50%)的第一个ΔR(i,i+1),行i可被识别为包括直接标记的行。一旦文档转换器102已识别跨越标记和/或包括直接标记的行,则文档转换器能够产生表格的标记树表示,例如根据许多已知技术中的任意一种技术,如图11的方框122中所示。更具体地说,例如,文档转换器能够产生供局部化标记之用的另一数据结构,该数据结构反映跨越标记和直接列标记相对于表格的单个单元格的关联。可被称作“标记树”的这种数据结构能够捕捉先前识别的跨越标记和直接列标记的结构。在这方面,根据一个例证实施例,图12举例说明了图9的表格的标记树表示。在文档转换器102产成表格的标记树表示之后,文档转换器能够局部化表格的标记。如方框124中所示,通过遍历标记树和数据结构表示,确定在表格的线性化表示内,标记的布置(placement),文档转换器能够局部化标记。这样,表格之后可被线性化,从而包括位于相应表格单元格附近的标记。可以理解,可按照许多不同方式中的任意一种方式,遍历标记树表示和数据结构。例如,在一个实施例中,文档转换器检查每行(j=1,...,R)的每列(i=1,...,C)的每个单元格,排除没有内容的任意单元格(即空白单元格)和包含跨越标记或直接标记的任意单元格。对于排除空白单元格和标记单元格的每行的每列,文档转换器定义从表格的树形标记表示(参见图12)的根节点到某一分枝的枝叶L的标记路径xk={x1,x2,.....xL},这里每个枝叶与表格的相应列相关。另外,文档转换器能够定义一个标记串Si,j,这里以每个单元格的0值初始化该标记串。对于表格的标记树表示的每个标记路径的每个节点k=(1,...,L),如果xk包含跨越标记,xk+1包含在xk下面的第一个节点,则文档转换器102能够把新的线条(line),连同跨越标记,另一新线条及至少一个字符空白(例如tab)一起加入标记串Si,j。另一方面,如果xk包含直接标记,则文档转换器可把直接标记,连同分隔符,例如冒号一起加入标记串Si,j。然后,在检查表格单元格并产生标记串Si,j之后,文档转换器可把每个标记串附到相应的单元格xij上,例如在表格的线性化过程中,下面说明。例如,考虑图9的表格和图12的标记树形表示,这里表格包括许多跨越标记和直接标记。在这种情况下,可从包含值“84-85”的单元格(3,1)开始检查表格的单元格。沿着标记树形表示的根节点到与第三行相关的枝叶,文档转换器102可定义标记路径xk={x1=″YR″}。另外,文档转换器能定义标记串S3,1,这里标记串被初始化为零。然后,由于x1包含直接标记,因此文档转换器可把直接标记连同冒号一起加入标记串Si,j,从而S3,1={″YR″}。随后可对单元格(3,2)重复相同的过程,这里S3,2={″TM″}。另一方面,对于单元格(3,3),文档转换器能定义标记路径xk={x1=“RegularSeason″;x2=″GP″}。在把标记串S3,3初始化为零之后,由于x1包含跨越标记并且x2(即xi+1)包含x1下的第一个节点,因此文档转换器可把新的线条连同跨越标记,另一新线条及tab一起加入标记串S3,3。之后,对于x2,文档转换器进一步可把直接标记和冒号加入标记串S3,3中。于是当终端10表现标记串时,标记串S3,3可表现为如下所示S3,3={\n;″RegularSeason″;\n;\t;″GP″},这里“\n”和“\t”分别表示一条新线和制表符。再次参见图5,一旦文档转换器102确定了标记串Si,j,从而局部化标记,则文档转换器能够把表格线性化成单元格的一维序列,如方框114中所示。文档转换器能够按照许多不同方式中的任意一种方式线性化表格。例如,在一个实施例中,通过用一个或多个独立段落(例如<p>)替换表格,文档转换器能够线性化表格,这里每个段落包含原始表格的一个或多个单元格。在这方面,文档转换器能够遍历具有行优先排序的表格,通常从左上侧的单元格开始,结束于右下侧的单元格,并把相应单元的内容转移到表格的线性表示的相应段落中,特别是当文档转换器排列电子文档的表格,以便具有行优先排序时。在一个实施例中,通过检查表格的数据结构表示,文档转换器102能够线性化表格。例如,考虑图13A中所示的包括表格的电子文档的数据结构表示。对于每个表格节点,文档转换器能够在和相应表格节点相同的层次,在数据结构中产生一个新的临时节点(图13B中表示成节点“X”)。然后,对于代表表格的一个单元格(通常排除空白单元格和标记单元格)的每个行节点(即<tr>)的每个数据节点(即<td>),文档转换器能够添加一个段落节点(例如<p>)作为节点“X”的子节点。如图13B中所示,之后文档转换器能移动每个数据节点的内容节点(即C1,C2等),或者更具体地说,在相应段落节点下面的相应单元格的内容xi,j,在图13B中,只有第一和第二内容节点C1和C2被表示成正在移动。除了移动在相应段落节点下面的每个内容节点之外,如果相应单元格具有对应的标记串,则文档转换器能够把相应的标记串Si,j附到相应单元格的内容上。在移动在相应段落节点下面的每个行节点的每个数据节点的内容节点之后,文档转换器102能够删除该表格节点和表格节点之下的相关行节点,数据节点和内容节点。虽然在移动每个行节点的每个数据节点的内容节点之后,文档转换器能够删除表格节点和相关的节点,但是另一方面,在移动或删除相应节点的所有子节点(即相关节点)之后,文档转换器能够删除每个节点。从而,例如,在移动在相应段落节点之下的相应内容节点(即C1,C2,C3等)之后,文档转换器能够删除每个表格数据节点(即<td>)。同样,例如,在删除相应表格数据节点(即<td>)之后,文档转换器能够删除每个表格行节点(即<tr>)。但是,不论文档转换器102何时删除表格节点,在移动在相应段落节点之下的每个行节点的每个数据节点的内容节点之后,文档转换器可从数据结构中消除节点“X”,并在电子文档的数据结构表示中,上移在节点“X”之下的每个节点,如图13C中所示。从而,如图所示,代表表格的每个单元格xi,j(排除空白单元格和标记单元格)的每个内容节点(即C1,C2等)可被包含在电子文档的数据结构表示的相应段落节点中。可以理解,在这种情况下,包括任意附添加标记串Sij的原始表格的每个单元格可被包含在一个独立的段落节点之下。但是,另一方面,文档转换器显然能够线性化表格,以致一个以上的单元格被包含在一个独立的段落节点之下。例如,文档转换器能够线性化表格,以致表格的每一行的单元格被包括在相应的段落节点之下。这种情况的一个例子参见图14,图14表示了图9的表格的线性化表示,其中表格的一个或多个单元格包含附加的标记串。一旦文档转换器102线性化了表格,文档转换器就可把电子文档的数据结构表示(包括表格的线性化表示)转换成电子文档,如图5的方框116中所示。可以理解,文档转换器可按照许多不同方式转换数据结构,例如按照和文档转换器把电子文档转换成中间数据结构(参见方框106)相反的方式。随后,一旦文档转换器102已把数据结构转回电子文档,其中电子文档现在包含包括在原始电子文档中的每个表格的线性表示,则代理18能把该电子文档转发给终端10,如方框117中所示。之后,终端能够表现该电子文档,例如在显示器(例如显示器54)上。在这方面,在这种显示器上表现图9的表格的例子,参见图15。如这里表示和说明的,文档转换器102能够接收包含至少一个表格的电子文档,之后转换该文档的表格信息,以便由终端10表现。随后文档转换器可把包括转换后的表格信息的电子文档,转发给终端,以便由所述终端表现,或者更具体地说,由终端的显示器(例如显示器56)表现。要注意的是在不同情况下,文档转换器可在未转换文档的表格信息的情况下,转发该电子文档。在这方面,可以理解在许多情况下,终端支持在宽度大于终端显示器宽度的显示窗口内的左-右全景伸缩。从而,在转换表格信息之前,文档转换器能够确定电子文档的终端接受者是否支持左右全景伸缩。之后,文档转换器可在没有转换表格信息的情况下转发电子文档。另一方面,文档转换器可请求,例如向终端的用户请求是转换电子文档的表格信息,还是在没有转换表格信息的情况下转发电子文档的选择。文档转换器102能够按照许多不同方式,确定终端10拍电子文档全景的能力。例如,文档转换器可保持包含一个或多个接收设备的清单,并指示所述每个接收设备是否支持拍电子文档全景的内部“设备能力”查寻表。这种情况下,文档转换器能够确定接收终端,例如在该终端和内容源100(例如HHTPGET)之间通信会话的建立过程中,之后在“设备能力”表查找终端。随后,在请求是否转换表格信息的选择之后,文档转换器能够据此接收并处理所述选择。在这方面,如果用户选择了在不转换表格信息的情况下转发电子文档,则文档转换器能够据此操作。否则,如果用户选择转换表格信息,或者如果终端不支持拍全景,则文档转换器能够转换表格信息,例如按照这里描述的方法。如同这里表示和描述的那样,能够从许多不同网络实体中的任意一个,例如终端10,代理18,或者内容源,例如始发服务器22,SMSC17,MMSC30,GGSN28,用户处理器34等操纵文档转换器102。但是,可以理解,可独立于与网络的连接执行文档转换器的各种操作,特别是转换构成电子文档同的至少一个表格的表格信息中的那些操作。因此,要明白操作文档转换器的网络实体可包含未与网络连接的实体,例如一个终端或一个内容源(例如始发服务器,SMSC,MMSC,用户处理器等)。这种情况下,例如,可按照独立于网络的许多不同方式中的任意一种方式,向网络实体提供电子文档,之后电子文档能够按照上述方式转换这种电子文档的表格。根据本发明的一个方面,本发明的系统的全部或部分,例如终端10,代理18,始发服务器22,SMSC17,MMSC30,GGSN28,和/或用户处理器34的全部或部分,通常在计算机程序产品(例如文档转换器102)的控制下工作。用于执行本发明实施例的方法的计算机程序产品包括计算机可读存储媒体,例如非易失性存储媒体,和计算机可读程序代码部分,例如包含在计算机可读存储媒体中的一系列计算机指令。在这方面,图5和图11是根据本发明的方法,系统和程序产品的流程图。要明白流程图的每个方框和步骤,以及流程图中方框的组合都可由计算机程序指令实现。这些计算机程序指令可装载在计算机或其他可编程设备上以产生某一机器,从而在计算机或其它可编程设备上执行的指令产生实现在流程图方框或步骤中规定的功能的装置。这些计算机程序指令也可保存在计算机可读存储器中,该存储器可指令计算机或其他可编程设备按照特殊方式起作用,从而保存在计算机可读存储器中的指令产生一件制造产品,所述制造产品包括实现在流程图方框或步骤中规定的功能的指令装置。计算机程序指令也可被装载到计算机或其他可编程设备上,导致在计算机或其他可编程设备上执行一系列操作步骤,产生计算机实现的过程,从而在计算机或其他可编程设备上执行的指令提供实现在流程图方框或步骤中规定的功能的步骤。因此,流程图的方框或步骤支持执行规定功能的装置的组合,执行规定功能的步骤的组合,以及执行规定功能的程序指令装置。另外要明白的是,流程图的每个方框或和步骤,以及流程图中方框或步骤的组合可由执行规定功能或步骤的基于专用硬件的计算机系统,或者专用硬件和计算机指令的组合来实现。根据在上面的说明及相关附图中给出的教导,本发明所属领域中的技术人员易于想到本发明的许多修改和其它实施例。例如,如上在一种实现中所述,文档转换器排列或重排列表格,以致表格具有行优先排序,之后根据这种行优先排序处理表格。但是,在一种备选实现中,文档转换器可排列或重排列表格,以致表格具有列优先排序,同时据此调整文档转换器的其他操作。例如,文档转换器能够利用按照和这里所述类似的方式执行的局部化过程,通常利用基于列执行基于行执行的操作,并且反之亦然,关于具有至少一列的列优先表格局部化标记,所述至少一列包括至少一个标记。于是,本发明显然并不局限于公开的具体实施例,并且修改和其它实施例包括在附加权利要求的范围内。虽然这里采用了具体术语,但只是在一般及描述意义上使用这些术语,并不是对本发明的限制。权利要求1.一种转换表格信息,以便在显示面积有限的终端上表现该表格信息的系统,所述系统包括网络实体,所述网络实体包括能够接收包括表格信息的电子文档的文档转换器,所述表格信息包括至少一个表格,其中,文档转换器能够根据每个表格的排序,并且当至少一个表格包括至少一个标记时,还根据所述至少一个标记,把至少一个表格转换为所述至少一个表格的线性表示。2.根据权利要求1的系统,其中文档转换器能够通过排列至少一个表格,以致所述至少一个表格具有预定排序,当至少一个表格包括至少一个标记时,局部化每个标记,之后,根据排列成具有预定排序的至少一个表格,并当至少一个表格包括至少一个标记时,还根据每个局部化标记,线性化所述至少一个表格,来转换所述至少一个表格。3.根据权利要求2的系统,其中每个表格包括按照至少一行和至少一列组织的多个单元格,其中文档转换器能够通过识别至少一个表格的自然排序,并且当所述至少一个表格具有除预定排序之外的自然排序时,排列具有除预定排序之外的自然排序的所述至少一个表格,以致相应的至少一个表格具有预定排序,来排列所述至少一个表格。4.根据权利要求3的系统,其中文档转换器能够确定表格的每个单元格的特征矢量,根据相应单元格的特征矢量,确定相邻单元格之间的距离,其中,文档转换器能够确定表格的同一行中各对相邻单元格之间的平均距离,和表格的同一列中各对相邻单元格之间的平均距离,之后,根据平均距离,识别表格的自然排序。5.根据权利要求2的系统,其中文档转换器能够排列至少一个表格,以致所述至少一个表格具有行优先排序和列优先排序之一。6.根据权利要求1的系统,其中文档转换器还能够确定终端是否支持拍全景,如果终端支持拍全景,则接收转换至少一个表格和在不转换至少一个表格的情况下转发电子文档这二者之一的选择,其中当所述选择包括转换至少一个表格时,文档转换器能够转换至少一个表格。7.一种局部化电子文档内表格的至少一个标记的系统,其中所述表格包括按照至少一行和至少一列组织的多个单元格,所述系统包括网络实体,所述网络实体包括能够识别至少一个跨越标记和至少一个直接标记中至少之一的文档转换器,其中每个跨越标记与表格的许多行和许多列之一相关,每个直接标记与表格的一列和一行之一相关,其中文档转换器还能够确定与跨越标记和直接标记至少之一相关的表格的每个单元格的标记串,从而局部化每个跨越标记和每个直接标记,每个标记串包括跨越标记和直接标记至少之一。8.根据权利要求7的系统,其中文档转换器能够根据表格的相邻行和相邻列之一之间的相似性量度,识别至少一个直接标记。9.根据权利要求8的系统,其中文档转换器能够通过确定每对相邻行和每对相邻列之一之间的相似性的量度,并根据相似性的量度,识别和其它各对相邻行相比,不相似性大于指定百分率的一对相邻行,及和其它各对相邻列相比,不相似性大于指定百分率的一对相邻列之一,之后,把识别的一对相邻行中的一行和识别的一对相邻列中的一列之一识别成包括至少一个直接标记,来识别至少一个直接标记。10.根据权利要求9的系统,其中文档转换器能够通过确定每对相邻行和每对相邻列之一的每个单元格的特征矢量,根据相应单元格的特征矢量,确定相邻行内同一列中单元格之间的距离,和相邻列内同一行中单元格之间的距离之一,之后,计算跨越相邻行的各列和相邻列的各行之一的距离的和,来确定相似性的量度。11.一种终端,包括能够存储包括表格信息的电子文档的存储器,所述表格信息包括至少一个表格;和控制器,所述控制器能够根据每个表格的排序,以及当至少一个表格包括至少一个标记时,还根据所述至少一个标记,把所述至少一个表格转换成所述至少一个表格的线性表示。12.根据权利要求11的终端,其中所述控制器能够通过排列至少一个表格,以致所述至少一个表格具有预定排序,当至少一个表格包括至少一个标记时,局部化每个标记,之后,根据排列成具有预定排序的至少一个表格,并当至少一个表格包括至少一个标记时,还根据每个局部化标记,线性化所述至少一个表格,来转换所述至少一个表格。13.根据权利要求12的终端,其中每个表格包括按照至少一行和至少一列组织的多个单元格,其中控制器能够通过识别至少一个表格的自然排序,并且当所述至少一个表格具有除预定排序之外的自然排序时,排列具有除预定排序之外的自然排序的所述至少一个表格,以致相应的至少一个表格具有预定排序,来排列所述至少一个表格。14.根据权利要求13的终端,其中所述控制器能够确定表格的每个单元格的特征矢量,并根据相应单元格的特征矢量,确定相邻单元格之间的距离,其中,控制器能够确定表格的同一行中各对相邻单元格之间的平均距离,和表格的同一列中各对相邻单元格之间的平均距离,之后,根据平均距离,识别表格的自然排序。15.根据权利要求12的终端,其中控制器能够排列至少一个表格,以致所述至少一个表格具有行优先排序和列优先排序之一。16.根据权利要求11的系统,其中控制器还能够确定终端是否支持拍全景,如果终端支持拍全景,则接收转换至少一个表格和在不转换至少一个表格的情况下转发电子文档这二者之一的选择,其中当所述选择包括转换至少一个表格时,控制器能够转换所述至少一个表格。17.一种终端,包括能够存储包括表格信息的电子文档的存储器,所述表格信息包括至少一个表格,每个表格包括按照至少一行和至少一列组织的多个单元格;能够识别至少一个跨越标记和至少一个直接标记中至少之一的控制器,其中每个跨越标记与表格的许多行和许多列之一相关,每个直接标记与表格的一列和一行之一相关,其中控制器还能够确定与跨越标记和直接标记至少之一相关的表格的每个单元格的标记串,从而局部化每个跨越标记和每个直接标记,每个标记串包括跨越标记和直接标记至少之一。18.根据权利要求17的终端,其中所述控制器能够根据表格的相邻行和相邻列之一之间的相似性量度,识别至少一个直接标记。19.根据权利要求18的终端,其中所述控制器能够通过确定每对相邻行和每对相邻列之一之间的相似性的量度,根据相似性的量度,识别和其它各对相邻行相比,不相似性大于指定百分率的一对相邻行,及和其它各对相邻列相比,不相似性大于指定百分率的一对相邻列之一,之后,把识别的一对相邻行中的一行和识别的一对相邻列中的一列之一识别成包括至少一个直接标记,来识别至少一个直接标记。20.根据权利要求19的终端,其中所述控制器能够通过确定每对相邻行和每对相邻列之一的每个单元格的特征矢量,根据相应单元格的特征矢量,确定相邻行内同一列中单元格之间的距离,和相邻列内同一行中单元格之间的距离之一,之后,计算跨越相邻行的各列和相邻列的各行之一的距离的和,来确定相似性的量度。21.一种转换表格信息,以便在显示面积有限的终端上表现表格信息的方法,所述方法包括接收包括表格信息的电子文档,所述表格信息包括至少一个表格;和根据每个表格的排序,并且当至少一个表格包括至少一个标记时,还根据所述至少一个标记,把至少一个表格转换为所述至少一个表格的线性表示。22.根据权利要求21的方法,其中转换至少一个表格包括排列至少一个表格,以致所述至少一个表格具有预定排序;当至少一个表格包括至少一个标记时,局部化每个标记;和根据排列成具有预定排序的至少一个表格,并当至少一个表格包括至少一个标记时,还根据每个局部化标记,线性化所述至少一个表格。23.根据权利要求22的方法,其中每个表格包括按照至少一行和至少一列组织的多个单元格,并且其中排列所述至少一个表格包括识别至少一个表格的自然排序;并且当所述至少一个表格具有除预定排序之外的自然排序时,排列具有除预定排序之外的自然排序的所述至少一个表格,以致相应的至少一个表格具有预定排序。24.根据权利要求23的方法,其中识别自然排序包括对于每个表格确定表格的每个单元格的特征矢量;根据相应单元格的特征矢量,确定相邻单元格之间的距离;确定表格的同一行中各对相邻单元格之间的平均距离,和表格的同一列中各对相邻单元格之间的平均距离;和根据平均距离,识别表格的自然排序。25.根据权利要求22的方法,其中排列至少一个表格包括排列至少一个表格,以致所述至少一个表格具有行优先排序和列优先排序之一。26.根据权利要求21的方法,还包括确定终端是否支持拍全景;如果终端支持拍全景,则接收转换至少一个表格和在不转换至少一个表格的情况下转发电子文档这二者之一的选择,其中转换至少一个表格包括当所述选择包括转换至少一个表格时,转换所述至少一个表格。27.一种局部化电子文档内表格的至少一个标记的方法,其中所述表格包括按照至少一行和至少一列组织的多个单元格,所述方法包括识别至少一个跨越标记和至少一个直接标记至少之一,其中每个跨越标记与表格的许多行和许多列之一相关,每个直接标记与表格的一列和一行之一相关;和确定与跨越标记和直接标记至少之一相关的表格的每个单元格的标记串,从而局部化每个跨越标记和每个直接标记,每个标记串包括跨越标记和直接标记至少之一。28.根据权利要求27的方法,其中识别至少一个直接标记包括根据表格的相邻行和相邻列之一之间的相似性量度,识别至少一个直接标记。29.根据权利要求28的方法,其中识别至少一个直接标记包括确定每对相邻行和每对相邻列之一之间的相似性的量度;和根据相似性的量度,识别和其它各对相邻行相比,不相似性大于指定百分率的一对相邻行,及和其它各对相邻列相比,不相似性大于指定百分率的一对相邻列之一;和把识别的一对相邻行中的一行和识别的一对相邻列中的一列之一识别成包括至少一个直接标记。30.根据权利要求29的方法,其中确定相似性的量度包括确定每对相邻行和每对相邻列之一的每个单元格的特征矢量;根据相应单元格的特征矢量,确定相邻行内同一列中单元格之间的距离,和相邻列内同一行中单元格之间的距离之一;以及计算跨越相邻行的各列和相邻列的各行之一的距离的和。全文摘要转换表格信息,以便在显示面积有限的终端上表现表格信息的系统包括网络实体。网络实体又包括能够接收包括表格信息的电子文档的文档转换器,所述表格信息包括表格。文档转换器能够根据每个表格的排序,并当至少一个表格包括至少一个标记时,还根据至少一个标记,把表格转换成表格的线性表示。更具体地说,文档转换器能够通过排列表格,以致表格均具有预定的排序,例如行优先排序或者列优先排序,来转换表格。随后,当表格包括至少一个标记时,文档转换器能够局部化每个标记,之后,根据排列的表格,并当表格包括至少一个标记时,还根据每个局部化标记,使表格线性化。文档编号H04M1/725GK1641632SQ20041004305公开日2005年7月20日申请日期2004年1月2日优先权日2004年1月2日发明者亚当·伯格,理查德·罗梅罗,格里高里·绍恩申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1