基于接收者的区域转换文本数据中区域敏感数据的装置和方法

文档序号:6422598阅读:111来源:国知局
专利名称:基于接收者的区域转换文本数据中区域敏感数据的装置和方法
技术领域
本发明涉及文本数据中区域敏感数据的转换。
背景技术
通常,在诸如电子邮件、聊天网站、即时消息传递、短消息传递系统的消息传递系统中,参与方在生成消息时必须进行他们自己的对区域敏感信息的转换。例如,如果位于德克萨斯州的第一方希望与弗吉尼亚州的另一方协调一项活动,则第一方必须明了德克萨斯州与弗吉尼亚州之间的时差,以便发送标明这项活动按照东部标准时间(EST)而不是中部标准时间(CST)的时间的消息。类似地,如果在美国的第一方希望向在日本的一方传送关于货币单位的信息,则需要第一方明了当前的汇率,以便将美元转换为日元。显然,如果发送消息的一方不知道时差、汇率和其他区域敏感的信息,则双方之间的通信可能会被曲解。

发明内容
根据第一方面,本发明提供了一种计算设备中用于转换文本数据中区域敏感数据的方法,包括接收文本数据,该文本数据包含区域敏感数据;识别该文本数据中的区域敏感数据;自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据;以转换后的区域敏感数据替换该文本数据中的区域敏感数据;以及输出含有转换后的区域敏感数据的该文本数据。
优选地,本发明提供了一种用于根据接收者的区域校正文本信息的装置和方法。更具体地,本发明优选地提供一种用于将文本数据的区域敏感部分从第一表示变为特定于该文本信息的接收者的区域的第二表示的装置和方法。
优选地,上述区域敏感数据包括时间数据、货币数据和日期数据中的至少一种。
在优选实施例中,自动转换区域敏感数据包括将该区域敏感数据从源计算设备的区域表示转换为标准化表示。
在优选实施例中,自动转换区域敏感数据包括将该区域敏感数据从标准化表示转换为目的计算设备的区域表示。
在优选实施例中,自动转换区域敏感数据包括将该区域敏感数据从对应于源区域的第一区域表示转换为对应于目的区域的第二区域表示。
在优选实施例中,上述标准化表示是格林威治标准时间(GMT)表示和国际标准化组织表示中的一种。
在优选实施例中,从源设备检索区域转换信息,且自动将上述文本数据中的区域敏感数据从第一表示转换为第二表示包括使用该区域转换信息进行从第一表示到第二表示的转换。
上述区域转换信息可以是货币汇率信息。
上述源设备可以是区域转换信息的第三方提供者。
作为举例,上述文本数据可以是即时消息传递消息、聊天消息、字母数字寻呼机消息、短消息传递系统消息、和电子邮件消息中的一种。
在一个实施例中,上述计算设备是源客户端设备和目的客户端设备中的一个。
在一个实施例中,上述计算设备是服务器,上述文本数据从源计算设备接收,且上述含有转换后的区域敏感数据的文本数据被输出到目的计算设备。
在一个实施例中,识别上述文本数据从其被接收到的源计算设备,并在注册表中识别该源计算设备的区域信息。自动转换敏感数据的步骤包括使用该源计算设备的区域信息转换该区域敏感数据。
在一个实施例中,通过对该文本数据进行解析,以识别一个或多个可能包含区域敏感数据的候选段;以及通过对该一个或多个候选段进行分析,以验证该一个或多个候选段包含区域敏感数据,来识别上述文本数据中的区域敏感数据。
在该实施例中,识别上述文本数据中的区域敏感数据进一步包括对上述一个或多个候选段进行分析,以识别包含在其中的区域敏感数据的类型,其中自动转换该区域敏感数据包括根据识别出的该区域敏感数据的类型来转换该区域敏感数据。
在该实施例中,对上述一个或多个候选段进行分析以验证该一个或多个候选段包含区域敏感数据的步骤和对上述一个或多个候选段进行分析以识别包含在其中的区域敏感数据的类型的步骤中的至少一个包括使用从模式数据库中检索出的区域模式。
在另一个可选实施例中,对上述一个或多个候选段进行分析以验证该一个或多个候选段包含区域敏感数据的步骤和对上述一个或多个候选段进行分析以识别包含在其中的区域敏感数据的类型的步骤中的至少一个包括检索并使用系统信息。
优选地提供了一种用于根据接收者的区域自动校正文本信息的装置和方法。即,优选地提供了一种用于自动识别文本信息中的区域敏感信息并将该区域敏感信息改变为基于接收者的区域的更易于为接收者理解的形式的装置和方法。
根据优选实施例,本发明提供了一种用于根据接收者的区域校正文本信息的装置和方法。优选地,用户输入含有区域敏感信息的文本消息。优选地,对该文本消息进行解析,以识别可能含有区域敏感信息的候选段。然后,优选地,使用一个或多个规则对这些候选段进行分析,以识别这些候选段中的一个或多个是否包含区域敏感信息以及包含在这些段中的区域敏感信息的类型。然后,优选地,根据该区域敏感信息和其类型,将该区域敏感信息转换为标准化表示。
根据优选实施例,然后,将上述文本消息的标准化版本发送给接收者,在该接收者处发生类似过程。也就是说,优选地,再次对该文本消息进行解析,以识别可能包含区域敏感信息的候选段。然后,优选地,对这些候选段进行分析,以确定它们是否包含区域敏感信息以及它们所包含的区域敏感信息的类型。然后,优选地,将该区域敏感信息转换为基于接收者的区域的区域依赖版本。然后,优选地,输出带有插入到其中的区域敏感信息的区域依赖版本的文本消息。
这样,利用本发明,用户可优选地以他们在将文本消息发送到他们同一区域中的另一方时会采用的方式输入文本消息。换句话说,用户无需了解他/她的区域与接收方的区域之间的差别。根据优选实施例,本发明自动转换文本消息中的区域敏感信息,以便接收方在他/她自己的区域的情境下理解该文本消息。
根据另一方面,本发明提供了一种计算机可读介质中用于转换文本数据中区域敏感数据的计算机程序产品,包括第一指令,用于接收文本数据,该文本数据包含区域敏感数据;第二指令,用于识别该文本数据中的区域敏感数据;第三指令,用于自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据;第四指令,用于以转换后的区域敏感数据替换该文本数据中的区域敏感数据;以及第五指令,用于输出含有转换后的区域敏感数据的该文本数据。
根据另一方面,本发明提供了一种用于转换文本数据中的区域敏感数据的装置,包括用于接收文本数据的装置,该文本数据包含区域敏感数据;用于识别该文本数据中的区域敏感数据的装置;用于自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据的装置;用于以转换后的区域敏感数据替换该文本数据中的区域敏感数据的装置;以及用于输出含有转换后的区域敏感数据的该文本数据的装置。
根据另一方面,本发明提供了一种用于转换文本数据中的区域敏感数据的计算机程序,该计算机程序包括当运行于计算机上时适于实现下述方法方法的程序代码手段接收文本数据,该文本数据包含区域敏感数据;识别该文本数据中的区域敏感数据;自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据;以转换后的区域敏感数据替换该文本数据中的区域敏感数据;以及输出含有转换后的区域敏感数据的该文本数据。


下面将仅以举例的方式并参考附图对本发明的实施例进行描述图1是本发明可以实现于其中的分布式数据处理系统的示例性方框图;图2是根据本发明优选实施例的服务器计算设备的方框图;图3是根据本发明优选实施例的客户端计算设备的方框图;图4是示出根据本发明优选实施例的总体操作的图示;图5是根据优选实施例的本发明主要操作部件的方框图;图6是示出根据本发明优选实施例的示例性文本消息的数据流的图示;以及图7是概述根据优选实施例的本发明示例性操作的流程图。
具体实施例方式
本发明的优选实施例实现于一个分布式数据处理环境中,在该环境中,寻求对其访问的计算系统作为客户端,而执行对设备标识符的验证的服务器作为该客户端的服务器。这样,此后,提供图1-3,作为本发明可在其中实现的环境和硬件设备的示例。
现在参照附图,图1示出了根据优选实施例的本发明可在其中实现的数据处理系统的网络的图示表示。网络数据处理系统100是本发明的优选实施例可在其中实现的计算机的网络。网络数据处理系统100包含网络102,其是用于提供网络数据处理系统100内连接在一起的各设备和计算机之间的通信链路的媒介。网络102可包含诸如有线、无线通信链路或者光纤缆线的连接。
在所示出的例子中,服务器104连同存储单元106一起连接到网络102。此外,客户端108、110、112连接到网络102。这些客户端108、110和112可以是例如个人计算机或者网络计算机。在所示出的例子中,服务器104向客户端108-112提供数据,诸如引导文件、操作系统映象和应用。客户端108、110和112是服务器104的客户端。网络数据处理系统100可包括其他的服务器、客户端和其他未示出的设备。在所示出的例子中,网络数据处理系统100是具有网络102的互联网,其代表使用传输控制协议/网际协议(TCP/IP)协议套件相互通信的网络和网关的世界范围的集合。互联网的核心是主节点或主机之间的高速数据通信线路的骨干,其中这些主节点或主机包括成百上千的商业、政府、教育和其他传送数据和消息的计算机系统。当然,网络数据处理系统100也可以实现为若干不同类型的网络,诸如内联网、局域网(LAN)、或广域网(WAN)。图1旨在作为例子,并不是作为对本发明的体系结构限制。
参照图2,其根据本发明的优选实施例示出了可实现为诸如图1中的服务器104的服务器的数据处理系统的方框图。数据处理系统200可以是包括连接到系统总线206的多个处理器202和204的对称多处理器系统(SMP)。可选地,可使用单处理器系统。连接到系统总线206的还有存储控制器/高速缓存208,它提供对于本地存储器209的接口。I/O总线桥210连接到系统总线206,并且提供对于I/O总线212的接口。存储控制器/高速缓存208和I/O总线桥210可以如图所示集成在一起。
连接到I/O总线212的外围部件互连(PCI)总线桥214提供对于PCI局部总线216的接口。若干调制解调器可以连接到PCI局部总线216。典型的PCI总线实现支持4个PCI扩展槽或者外加连接器。通过外加板连接到PCI局部总线216的调制解调器218和网络适配器220可提供图1中的到客户端108-112的通信链路。附加PCI总线桥222和224提供对于附加PCI局部总线226和228的接口,附加PCI局部总线226和228可以支持附加的调制解调器或网络适配器。如此,数据处理系统200允许连接多个网络计算机。内存映射的图形适配器230和硬盘232也可以如图所示直接或间接地连接到I/O总线212。
本领域的普通技术人员将理解,图2中所示的硬件可以变化。例如,诸如光盘驱动器之类的其他外围设备也可用来附加于或者替代图中所示的硬件。所示出的例子并不意味着对于本发明体系结构限制。
图2中示出的数据处理系统可以是例如运行高级交互执行(AIX)操作系统或LINUX操作系统的IBMe服务器p系列系统,它是纽约Armonk的国际商业机器公司的产品。
现在参照图3,其示出了根据优选实施例可在其中实现本发明的数据处理系统的方框图。数据处理系统300是客户端计算机的一个例子。数据处理系统300采用外围部件互连(PCI)局部总线体系结构。虽然所示出的例子采用PCI总线,也可使用其他总线体系结构,诸如加速图形接口(AGP)和工业标准体系结构(ISA)。
处理器302和主存储器304通过PCI桥308连接到PCI局部总线306。PCI桥308还可包括用于处理器302的集成存储器控制器和高速缓存。其他到PCI局部总线306的连接可以通过直接部件互连或通过外加板来实现。在所示出的例子中,局域网(LAN)适配器310、SCSI主机总线适配器312和扩展总线接口314通过直接部件互连连接到PCI局部总线306。相反,音频适配器316、图形适配器318、和音频/视频适配器319通过插入到扩展槽中的外加板连接到PCI局部总线306。扩展总线接口314提供对于键盘和鼠标适配器320、调制解调器322和附加存储器324的连接。小型计算机系统接口(SCSI)主机总线适配器312提供对于硬盘驱动器326、磁带驱动器328、和CD-ROM驱动器330的连接。典型的PCI局部总线实现将支持3个或4个PCI扩展槽或外加板。
操作系统运行于处理器302上,并用于协调和提供对图3的数据处理系统300中的各部件的控制。该操作系统可以是可购买到的操作系统,诸如WindowsXP,其可从Microsof公司获得。(Microsoft和Windows是在美国、其他国家或两者的微软公司的商标)。诸如JavaTM的面向对象的程序运行系统可以与操作系统协同运行,并提供从数据处理系统300上执行的Java程序或应用对该操作系统的调用。“Java”是Sun微系统公司的商标。该操作系统的指令、面向对象的操作系统和应用或程序位于诸如硬盘驱动器326的存储设备上,并可加载到主存储器304中供处理器302执行。
本领域的普通技术人员可以理解,图3中的硬件可根据实现的不同而变化。其他诸如快闪只读存储器(ROM)或等效非易失性存储器、或光盘驱动器之类的内部硬件或外围设备可用来附加于或替代图3中所示的硬件。本发明的处理可应用于多处理器数据处理系统。
作为另外一个例子,数据处理系统300可以是一个独立的系统,其配置成无需依赖某种类型的网络通信接口便可引导。作为进一步的例子,数据处理系统300可以是个人数字助理(PDA)设备,其配置成具有ROM和/或快闪ROM,以便提供用于存储操作系统文件和/或用户生成的数据的非易失性存储器。
图3中示出的例子及上面描述的例子并不意味着体系结构限制。例如,数据处理系统300除了采用PDA的形式之外,还可以是笔记本计算机或手持计算机。数据处理系统300还可以是信息亭或Web设备。
如前面所提及的,根据优选实施例,本发明提供一种用于将含有区域敏感数据的文本数据自动转换或校正为特定于该文本数据的接收者的区域的表示的机制。本说明书中使用的术语“区域”意指计算设备的地理位置。术语“区域”不一定限于时区、国界等。任何地理位置都可用作“区域”。因此,在本发明的情境下,例如,同一时区和同一国家内的地区可能组成不同的区域。
本发明可例如与本领域中公知的多种不同文本消息传递系统协同使用。例如,本发明可以添加到电子邮件系统、即时消息传递系统、聊天系统、字母数字寻呼系统、蜂窝电话系统和寻呼机(例如DOCOMO)中的短消息传递系统(SMS)等中。可选地,本发明可作为这种文本消息通过其被发送的网络中的服务来提供。例如,可以提供一种包括本发明的特征的服务器。该服务器可以诸如在正常的发送文本消息的活动中截取该文本消息,并执行此后描述的将所接收的文本消息转换为标准化形式或甚至是特定于接收方的区域的形式的功能。
图4从分布式数据处理系统的角度示出了本发明优选实施例的总体操作。如图4所示,第一客户端设备405位于第一区域410,第二客户端设备408位于第二区域420。客户端设备405和408可以是任何能够发送和接收文本消息的计算设备。例如,客户端设备405和408可以是个人计算机、个人数字助理、无线通信设备(例如蜂窝电话或寻呼机)、膝上型计算机或类似设备。
优选地,这两个客户端设备405和408通过网络402相互通信。在一些实施例中为了便利区域敏感信息的转换,和/或在其他实施例中为了提供对区域敏感信息进行转换所需的区域转换信息(例如货币汇率),而提供服务器405。
例如,在本发明的一个实施例中,服务器450将本发明的所有功能提供为对客户端设备405和408的服务。也就是说,文本消息经由服务器450在客户端设备405和408之间传送,而服务器450在将该文本消息发送给接收客户端设备之前将区域敏感信息转换为特定于区域的表示。在一个实施例中,这需要客户端设备405和408向服务器450进行登记,并提供区域信息,诸如时区、国家标识符、设备标识符(例如,IP地址、MAC地址等),供在进行这样的转换时使用。当接收到文本消息时,设备标识符被优选用作在服务器的客户端设备注册表中查找源客户端设备和/或目的客户端设备的区域信息的途径,以便进行转换。服务器450进行这种转换所使用的附加信息可包括例如区域410和区域420之间的当前货币汇率。
在一个可选实施例中,本发明完全在客户端设备405和408自身中实现,而不需要服务器450。在这样的实施例中,可以根本不使用服务器450,或者仅将服务器450用于检索在对区域敏感信息进行转换时要使用的附加信息,诸如货币汇率。
如图4所示,根据优选实施例的本发明的根本目的在于允许第一个区域410中的第一客户端设备405处的用户以该用户在向同一区域中的其他客户端设备发送文本信消息时通常会采用的方式输入文本信息,并使该文本消息中的区域敏感信息自动转换为适合于第二区域420的表示。在所示的例子中,客户端设备405的用户输入文本信息430,其含有文本“Jack与我在6:30会面”。由于区域410和区域420之间的时差,这条消息接着被转换为含有文本“Jack与我在7:30PM EST会面”的文本消息440。
根据本发明的优选实施例,用户将文本消息输入到计算设备中,其中该文本消息包含区域敏感信息。这一文本消息可以是例如电子邮件消息、即时消息、聊天消息、通过蜂窝电话或寻呼机输入的文本消息等。
区域敏感信息是其形式和内容通常会根据用户的特定区域而改变的任何信息。区域敏感信息的例子包括,但不限于时间、日期和货币。也就是说,如果在第一区域(诸如德克萨斯州)输入了6:30PM的时间,则由于时区的差异,在弗吉尼亚州该相同的时间为7:30PM。此外,在不同的国家,时间可能是以不同形式书写的,例如1830点钟或者6.30PM。
同样,如果在美国输入了日期May 6,2002,则这个日期在欧洲将被书写为6May 2002。至于货币,可使用各种符号来表示货币面值,并且货币根据汇率将是不同的。这样,根据接收者的特定区域,可使用不同的货币单位和(取决于汇率的)货币量。
优选地,文本信息输入到其中的计算设备或网络上的计算机对文本消息进行解析,以识别可能包含区域敏感信息的候选段。为了说明的目的,下面描述的实施例将假设本发明的功能实现于客户端设备或计算设备自身中,而不是实现于网络上的服务器中。但是,这些计算设备可以利用从网络上的服务器获得的信息来帮助区域敏感信息的转换,例如,可以从服务器中检索货币汇率,以便进行文本消息中的货币转换。
建立一个表示区域敏感信息的模式的数据库,并在对文本数据进行解析期间使用它来识别可能包含区域敏感数据的文本数据段。例如,在一个实施例中,将文本数据标记化,即将其分解成段或标记,然后将每一段或标记中的文本数据与模式数据库中的模式列表比较。如果一个段包含一个或多个模式,则该段被指示为是一个其中含有区域敏感信息的候选段。
例如,每一个文本数据段可以与诸如“$”、“:”、“PM”、“AM”、“EST”之类的模式信息进行比较。如果一个文本数据段或标记包含这些模式中的一个或多个,则该文本数据段被标记为含有区域敏感信息的候选段。
然后,使用模式数据库、系统信息、及一个或多个规则对候选文本数据段进行分析,以识别这些候选字段中的一个或多个是否包含区域敏感信息以及包含在这些段中的区域敏感信息的类型。该分析可以基于一个更详尽的模式数据库,在该数据库中,更加复杂的模式用于提供对该段是否包含区域敏感信息的更加准确的判定。这些模式可以具有相关的区域信息类型,该类型可用于确定该区域信息将如何被转换为标准化表示。
此外,在一个实施例中,从计算设备操作系统获得信息,以标识该计算设备的当前设置,例如中部标准时间、东部标准时间、国家标识等。优选地,所有这些信息一起用于确定包含在文本消息中的区域敏感信息的类型和从其接收到该文本消息的源计算设备的区域。然后,在优选实施例中,基于区域敏感信息的类型和源计算设备的区域应用规则,籍此实现将区域敏感信息转换为标准化表示的功能,其中的标准化表示诸如ISO标准时间表示、格林威治标准时间(GMT)表示、标准货币表示(例如,美元)等。这样的规则的一个例子是如果该区域敏感信息是时间信息且发送该信息的区域是中部时区,则为了将此时间转换为ISO标准时间,对该区域敏感信息执行一组特定函数。
应当指出,向标准化表示的转换被提供为一种用于在从区域敏感信息的源区域表示到目的区域表示的转换中减少错误的手段。然而,在一些实施例中,取消了向标准化表示的转换,文本消息以未改动的源区域表示发送给接收者。在这样的实施例中,在目的计算设备中进行从源区域表示到目的区域表示的转换。
当然,利用这样的实施例,关于源区域表示的信息必须与消息一起来提供,或者可基于该消息以其他方式获得,诸如从可用于查寻消息的特定发送者的区域的发送者列表获得。在没有关于源区域的某些附加信息的情况下,对于目的设备来说准确地将源区域表示转换为目的区域表示可能是不可能的。将源区域表示转换为标准化表示的一个益处在于“标准化区域”通常对于目的设备来说是已知的。这样,目的设备仅需要能够从标准化区域转换为它自己的区域,而不需要具有任何有关发送者的区域的信息。
此外,在文本消息的源端和文本消息的目的端都向服务器进行了注册的服务器实现的情况下,向标准表示的转换可能不是必须的,且该转换可以从源区域表示到目的区域表示直接实现。但是,为了说明的简单起见,假设转换是从区域敏感信息的源区域表示到标准表示,并从标准表示到目的区域表示的。
一旦生成了区域敏感信息的标准化表示,并将其用于替换文本消息中的源区域表示,该文本消息便被发送到目的计算设备,在该目的计算设备处发生类似的过程。也就是说,该文本消息再次被解析,以识别可能包含区域敏感信息的候选段。然后,对候选段进行分析,以确定它们是否包含区域敏感信息且它们所包含的是什么类型的区域敏感信息。然后,根据目的计算设备的区域将区域敏感信息转换为目的区域表示。然后,输出带有插入到其中的区域敏感信息的目的区域表示的文本信息。
优选地,根据用于将源区域表示转换为标准表示的类似的目标计算设备信息、规则等,来确定将标准表示转换成的特定目的区域表示。此外,优选地,建立用户偏好,用于确定怎样在目的计算设备上表示标准化区域敏感信息。例如,这些用户偏好可包括诸如采用12小时还是24小时时钟、是否使用特定的时间分隔符、是否使用特定的货币单位等设置。此外,用户偏爱可包括关于是否执行区域敏感信息的全部转换、是否将原始区域信息与转换后的区域信息一起显示(例如在圆括号中)。
应该指出,存在一些可能看来是区域敏感信息,但实际上不是的文本数据。例如,一个流逝的时间可能象区域敏感时间,但实际上,不管区域如何,都会流逝相同的时间量。优选地,建立带有用于确定这样的文本数据及相应地对其进行处理(例如,对其不进行转换)的充足的模式和规则的、本优选实施例的模式数据库和规则。
因此,本发明提供一种用于将区域敏感信息从源区域表示转换为目的区域表示的自动机制。本发明可实现于客户端设备、一个或者多个服务器、或者客户端设备与一个或多个服务器的组合中。
图5是根据优选实施例的本发明的主要操作部件的方框图。图5中所示的组件可以在不背离本发明的实质和范围的情况下,实现为软件、硬件、或软件和硬件的组合。在一个优选实施例中,图5中所示的组件实现为由一个或多个处理器执行的软件指令。
如图5所示,该优选实施例的区域敏感信息转换装置包括控制器模块510、接口模块520、标记化/解析模块530、分析模块540、模式数据库550、用户设置存储模块560、转换模块570、和规则数据库580。组件510-580通过控制/数据信号总线590相互通信。
控制器模块510控制该装置的总体操作,并协调组件520-580的操作。接口模块520提供输入/输出接口,通过它接收文本消息、接收用户输入、并输出转换后的文本消息。
标记化/解析模块530将接收到的文本消息分解成段,并对每一段进行解析以识别出其中可能含有区域敏感文本的候选段。分析模块540分析候选段,以识别出确实含有区域敏感文本的候选段,并识别出包含在那些候选段中的区域敏感文本的类型。在一个实施例中,标记化/解析模块530和分析模块540使用从模式数据库550获得的模式、通过接口模块520从计算系统获得的系统信息、以及从规则数据库580获得的规则。
转换模块570将区域敏感信息转换为该区域敏感信息的标准化表示或一个区域表示。如果文本消息是从另一计算设备接收的,并且区域敏感信息被指示为是以标准化形式的,则转换模块570将标准化区域敏感信息转换为一个区域表示。否则,如果文本消息是由图5的装置所驻留的计算设备的用户输入的,则转换是从区域表示到标准化表示的。由根据分析模块540识别出的区域信息的类型、通过接口模块520检索到的系统信息和在用户设置存储模块560中设置的用户设置从规则数据库中检索到的规则来控制所执行的特定转换。
转换模块570将转换后的区域信息输出到控制器模块510,然后,控制模块510将该转换后的区域信息替换原始区域信息而并入到文本消息中。然后,控制器模块510通过接口520输出转换后的文本信息。
图6是示出根据本发明优选实施例的示例文本消息的数据流的图示。如图6所示,用户使用第一计算设备输入文本消息“Jack与我在6:30会面”605,并指示该第一计算设备将该消息发送给第二计算设备620。作为响应,本优选实施例的装置对该消息进行标记化和解析,以识别出包含区域敏感内容的段(612)。然后,对这些段进行分析,以识别出实际上确实包含区域敏感信息的段和它们确实包含的区域敏感信息的类型(614)。然后,根据区域信息的类型和系统区域设置,对区域信息进行标准化(616)。然后,将标准化的文本消息“Jack与我在13:30GMT会面”输出到第二计算设备620。
第二计算设备620接收标准化文本消息630,并再次对该文本信息进行标记化和解析,以识别出含有区域敏感信息的段(622)。然后,对这些段进行分析,以识别出实际上确实含有区域敏感信息的段和它们确实含有的区域敏感信息的类型(624)。然后,根据区域信息的类型和系统区域设置,将该区域信息转换为本地表示(626)。然后,通过第二计算设备620输出含有区域敏感信息的区域表示的文本消息640“Jack与我在7:30PMEST会面”。如在该技术领域中公知的,输出可以采用文本的形式显示或者语音形式输出。
图7是概述本发明的示例性操作的流程图。如图7所示,该操作开始于接收到一个含有区域敏感文本的文本数据(步骤710)。然后,对该文本数据进行解析,以识别含有区域敏感文本的段(步骤720)。然后,对识别出的段进行分析,以确认区域敏感文本的存在,并确定包括在其中的区域敏感文本的类型(步骤730)。然后,将该区域敏感文本转换为标准化表示或者本地表示(步骤740)。然后,输出转换后的文本(步骤750)。
因此,用户可以他们在向他们同一区域中的另一方发送文本信息时会使用的方式来输入文本消息。换句话说,用户无需了解他/她的区域与接收方的区域之间的差别。文本消息中的区域敏感信息被自动转换,以便接收方在他/她自己的区域的情境下理解该文本消息。
应该重要指出,尽管在功能完整的数据处理系统的情境下对本发明进行了描述,但本领域的普通技术人员将理解,本发明的处理能够以指令的计算机可读介质的形式和各种形式来分发,并且不管实际用于实现该分发的信号载体介质的特定类型如何,本发明都同样适用。计算机可读介质的例子包括可记录类型介质(诸如,软盘、硬盘驱动器、RAM、和CD-ROM)和传输类型介质(诸如,数字和模拟通信链路)。
权利要求
1.一种计算设备中用于转换文本数据中区域敏感数据的方法,包括接收文本数据,该文本数据包含区域敏感数据;识别该文本数据中的区域敏感数据;自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据;以转换后的区域敏感数据替换该文本数据中的区域敏感数据;以及输出含有转换后的区域敏感数据的该文本数据。
2.权利要求1的方法,其中上述区域敏感数据包括时间数据、货币数据和日期数据中的至少一种。
3.权利要求1的方法,其中自动转换区域敏感数据包括将该区域敏感数据从源计算设备的区域表示转换为标准化表示。
4.权利要求1的方法,其中自动转换区域敏感数据包括将该区域敏感数据从标准化表示转换为目的计算设备的区域表示。
5.权利要求1的方法,其中自动转换区域敏感数据包括将该区域敏感数据从对应于源区域的第一区域表示转换为对应于目的区域的第二区域表示。
6.权利要求1的方法,还包括从源设备检索区域转换信息,其中自动将上述文本数据中的区域敏感数据从第一表示转换为第二表示包括使用该区域转换信息进行从第一表示到第二表示的转换。
7.权利要求6的方法,其中上述源设备是区域转换信息的第三方提供者。
8.权利要求1的方法,其中上述计算设备是源客户端设备和目的客户端设备中的一个。
9.权利要求1的方法,其中上述计算设备是服务器,上述文本数据从源计算设备接收,且上述含有转换后的区域敏感数据的文本数据被输出到目的计算设备。
10.权利要求1的方法,还包括识别上述文本数据从其被接收到的源计算设备;在注册表中识别该源计算设备的区域信息,其中自动转换敏感数据包括使用该源计算设备的区域信息转换该区域敏感数据。
11.权利要求1的方法,其中识别上述文本数据中的区域敏感数据包括对该文本数据进行解析,以识别一个或多个可能包含区域敏感数据的候选段;以及对该一个或多个候选段进行分析,以验证该一个或多个候选段包含区域敏感数据。
12.权利要求11的方法,其中识别上述文本数据中的区域敏感数据进一步包括对上述一个或多个候选段进行分析,以识别包含在其中的区域敏感数据的类型,其中自动转换该区域敏感数据包括根据识别出的该区域敏感数据的类型来转换该区域敏感数据。
13.权利要求12的方法,其中对上述一个或多个候选段进行分析以验证该一个或多个候选段包含区域敏感数据的步骤和对上述一个或多个候选段进行分析以识别包含在其中的区域敏感数据的类型的步骤中的至少一个包括使用从模式数据库中检索出的区域模式。
14.权利要求12的方法,其中对上述一个或多个候选段进行分析以验证该一个或多个候选段包含区域敏感数据的步骤和对上述一个或多个候选段进行分析以识别包含在其中的区域敏感数据的类型的步骤中的至少一个包括检索并使用系统信息。
15.一种计算机可读介质中用于转换文本数据中区域敏感数据的计算机程序产品,包括第一指令,用于接收文本数据,该文本数据包含区域敏感数据;第二指令,用于识别该文本数据中的区域敏感数据;第三指令,用于自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据;第四指令,用于以转换后的区域敏感数据替换该文本数据中的区域敏感数据;以及第五指令,用于输出含有转换后的区域敏感数据的该文本数据。
16.一种用于转换文本数据中的区域敏感数据的装置,包括用于接收文本数据的装置,该文本数据包含区域敏感数据;用于识别该文本数据中的区域敏感数据的装置;用于自动将该文本数据中的区域敏感数据从第一表示转换为第二表示,从而生成转换后的区域敏感数据的装置;用于以转换后的区域敏感数据替换该文本数据中的区域敏感数据的装置;以及用于输出含有转换后的区域敏感数据的该文本数据的装置。
17.一种用于转换文本数据中的区域敏感数据的计算机程序,该计算机程序包括当运行于计算机上时适于实现权利要求1-14中任意一项的方法的程序代码手段。
全文摘要
本发明提供了一种用于转换文本数据中区域敏感数据的方法、装置和计算机程序。接收文本数据,其包含区域敏感数据。识别区域敏感数据,并自动将其从第一表示转换为第二表示,以便生成转换后的区域敏感数据;以转换后的区域敏感数据替换该文本数据中的区域敏感数据,且然后输出含有转换后的区域敏感数据的该文本数据。
文档编号G06F9/44GK1723437SQ200380105710
公开日2006年1月18日 申请日期2003年11月28日 优先权日2002年12月12日
发明者D·R·戴, D·A·谢尔 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1