翻译工具的制作方法

文档序号:6502810阅读:281来源:国知局
专利名称:翻译工具的制作方法
技术领域
本发明涉及电子通信,尤其涉及具有语言翻译的电子通信。
背景技术
随着国际间相互作用变得越来越普遍,人们更可能遇到语言障碍。语言障碍可能出现在很多种情况下,例如与外国公司的贸易或谈判,在外国领地内的多国军事行动的军队合作,与外国国民的通信或者对来自其它国家的人展示信息。
商业上已有计算机程序,其可以接收文本为源语言的文档并且将文本翻译成目标语言。然而,这些程序易于出错。结果,所得到的目标语言文档可能不能传递预定的含义。翻译也可能影响所得文档的格式化,以至于所得文档看起来不同于源文档。

发明内容
一般地,本发明涉及文本翻译工具,其对于翻译相关的电子文档尤其有用。相关的电子文档是指彼此相关的电子形式的任意文档,例如电子幻灯片、电子表格条目、书本的页面、一组收集的文本文件、一组包括文本的图等等。
本发明提供将源文本从源语言的源文档翻译到目标语言的目标文本。本发明进一步提供根据源文本的格式特征而映射目标文本到目标文档。结果,目标文档保留了源文档的一些“外观和感觉”。在包括一个或多个图形元素的源文档中,本发明支持映射图形元素到目标文档。
在示例应用中,用户可以翻译具有第一语言文本的一组电子源幻灯片,生成一组看起来类似于源幻灯片的第二语言目标幻灯片。目标幻灯片通常保留了源幻灯片的图形元素和格式特征。
本发明可以通过执行任意几个翻译引擎的任意几个翻译装置而实施。如果翻译装置遇到了不确定性,例如潜在的首字母缩写词(acronym),翻译装置就会询问用户关于这个不确定性,然后可能会至少部分地基于用户对询问的响应将源文本翻译成目标语言。翻译装置也可能会记住用户解决这个不确定性的方式,并可能以相同的方式去解决后来的不确定性情况而不询问用户。
在一实施例中,本发明涉及一种包括展示源文档给用户的方法。源文档包括源语言的源文本和至少一个图形元素。该方法也包括映射图形元素到目标文档,通过将源文本翻译成目标语言而生成目标文本,映射目标文本到目标文档。
在另一实施例中,本发明展示了一种方法。该方法包括识别在一组相关电子文档的第一源文档中不确定性的第一情况。第一源文档包括源语言的第一源文本。该方法进一步包括询问用户关于不确定性,接收用户对询问的响应,并至少部分地基于响应而将第一源文本翻译成目标语言。当不确定性的第二情况在该组相关电子文档的第二源文档中被识别时,该方法包括至少部分地基于对于询问的响应而将第二源文本翻译成目标语言。用户不需要被重新询问。
在另外的实施例中,本发明包括计算机可读介质,其包括使可编程处理器执行任意以上方法的指令。
本发明还涉及一种配置用于执行任意所述方法的系统。在附加的实施例中,本发明展示了一种包括显示器的系统,该显示器配置为展示给用户包括源语言的源文本的源文档,同时展示给用户包括目标语言的目标文本的目标文档。该系统也包括处理器,其配置为将源文本翻译为目标文本,并进一步配置为根据源文本的格式特征映射目标文本到目标文档。
在附图和下面的描述中给出了本发明的一个或多个实施例的细节。


图1的概念图示出了一组相关电子文档及其翻译版本。
图2的示例显示器的屏幕快照描述了同时提供源电子文档和目标电子文档。
图3的方块图示出了可以实施本发明的示例翻译装置。
图4的流程图示出了翻译装置的首字母缩写词扩展操作。
图5的流程图示出了根据本发明实施例的一组相关电子文档的翻译。
具体实施例方式图1的概念图示出了一组相关电子文档。在图1的实例中,文档包括可伴随着展示的演示性展现,例如电存储在个人计算机上的文本和图形的幻灯片。演示性展现包括,例如,用例如MicrosoftPowerPoint的应用程序所准备的幻灯片展示。然而,本发明不限于幻灯片展示,还可被其它组的相关电子文档使用,例如书本的页面或一组收集的报告。
在图1的实例中,展示的主题是医学综合病症。展示可以包括任意数目的幻灯片,但是示出了两个幻灯片12A和14A。幻灯片12A包括说明文本16A,作为标题的附加文本18A,以及图形元素20A。类似地,幻灯片14A包括说明文本22A,标题24A,附加文本26A,以及图形元素28A。在幻灯片12A和14A中,标题18A,24A恰好是首字母缩写词,“AIDS”,其代表获得性免疫缺损综合症。
本发明提供将相关电子文档从源语言翻译为目标语言的技术。在图1中,源语言是英语,目标语言是西班牙语。幻灯片12A和14A是“源”幻灯片。所翻译的或“目标”幻灯片在图1中示为幻灯片12B和14B。
目标幻灯片12B和14B包括出现在原始的源幻灯片12A和14A中的元素。尤其是,目标幻灯片12B包括说明文本16B,作为标题的附加文本18B,以及图形元素20B。类似地,幻灯片14B包括说明文本22B,标题24B,附加文本26B,以及图形元素28B。
特别地,目标幻灯片12B和14B在外表上类似于源幻灯片12A和14A。虽然文本已经从英语翻译为西班牙语,但是幻灯片的大部分格式化都被保留下来了。尤其是,源幻灯片12A、14A中文本的大小、字体和位置几乎与目标幻灯片12B、14B中的一样。文本的属性,例如文本26A的斜体字,也保留了下来,文本26B也同样是斜体字。另外,源幻灯片12A、14A中图形元素的位置和大小也几乎与目标幻灯片12B、14B中的一样。
标题18A和24A的文本恰好包括首字母缩写词,“AIDS”,其在图1的实例中代表“获得性免疫缺损综合症”。在目标幻灯片12B和14B中,标题18B和24B同样包括首字母缩写词。“SIDA”,相应于“AIDS”的西班牙语首字母缩写词,代表“Sindrome deInmunodeficiencia Adquirida”。如下面所述,翻译支持首字母缩写词的识别,在翻译文本中首字母缩写词的保留,以及当在目标语言中没有可比首字母缩写词时首字母缩写词的扩展。另外,本发明支持以前的(one-time)首字母缩写词处理,以便翻译者可以一致地翻译出现在该组相关电子文档中的首字母缩写词。
图2是显示器40的示意性屏幕快照,显示源语言电子文档以及相应的目标语言翻译电子文档。在图2的实例中,幻灯片14A和14B是并排显示的。并排显示使得易于比较源幻灯片和目标幻灯片14A和14B。用一个命令,用户就可以翻译该组中所有的幻灯片,并当目标文档和源文档同时给出时可以比较每一个目标文档和每一个源文档。这样,用户可以根据源幻灯片和目标幻灯片的实际布局和格式特征而看到它们。
显示器40也显示了示意性的编辑工具42,用户可以使用其来校正、调整、细调源文档或目标文档。图2中描述的工具是用于示意的目的,本发明可用任意编辑工具。然而,本发明的优点是可需要更少的用户编辑。本发明在提供文本翻译的同时保留了源文档的图形和格式化。例如,用户通常不必从源文档到目标文档进行“剪切及粘贴”图形元素。
在本发明的示例实施例中,对源文档或一组源文档的改变导致了对目标文档或一组目标文档的自动改变。例如,源幻灯片14A加入了新的图形元素导致相同的图形元素被加入到目标幻灯片14B。幻灯片14A中文本的改变自动地改变了幻灯片14B中相应的翻译文本。对源组进行重排幻灯片或者加入新幻灯片自动导致了目标中的重排或者新幻灯片。
虽然在图2中示出了单个的目标幻灯片14B,但是本发明支持多目标文档。例如,用户可以生成西班牙语的第一组目标文档,法语的第二组文档,日语的第三组文档等等。在本发明的一个实施例中,对源文档或者一组源文档的改变导致了对每一个目标文档或者每一组目标文档的自动改变。
一示例编辑工具是首字母缩写词扩展器44。首字母缩写词扩展器识别潜在的首字母缩写词并且提供给用户一个或多个关于翻译首字母缩写词的选择。对示例首字母缩写词扩展器的操作在下面进行描述。
另外一个示例工具是幻灯片选择器46。通过在幻灯片选择器46上选择幻灯片,用户可以在一组相关幻灯片中导航。选择源组的第二幻灯片,例如,可以导致源组和目标组的第二幻灯片都出现。类似地,选择特定的目标幻灯片可以引起相应的源幻灯片被自动选择。
另一个示例工具是发现一个词或者短语的其它可能含义的搜索工具48。其它可能含义可根据例如普通人使用频率的标准而排序(ranked)。在图2的实例中,搜索工具48根据用户的先前用法而将含义排序。搜索工具48可以进一步包括来自翻译引擎的一个词或者短语的默认翻译。用户可以在源文档或者目标文档中选择任意的词或者短语,可以接收含义的列表并可以选择最接近用户希望传递的信息的含义。
本发明不限于图2中示出的特定编辑工具。而且,本发明支持在不改变源文档的情况下编辑目标文档。用户可能满意源文档但是可能不满意在相应目标文档中的翻译。因此,用户可以在不改变源文档的情况下直接编辑目标文档。
通常,目标文档中的目标文本具有由源文档中的源文本所定义的相同的位置、大小、字体、风格和其它格式特征。然而,在一些情况下,保留源文本的所有格式特征可能并不可行。源文本可包括翻译成较长词或短语的词或短语。因此,本发明支持一个或多个格式特征的自动改变,例如为目标文本选择不同大小或者不同字体。
本发明进一步支持在没有编辑工具情况下并排显示源文档和目标文档。当用户为小组展示幻灯片时,显示器40可以配置成同时显示源幻灯片和目标幻灯片。
图3是可以执行本发明技术的计算机系统50的功能方框图。计算机系统50的一些组件示意成逻辑上分离,即使这些组件可以在单个装置中实现。除计算机系统50外的翻译装置也可以执行本发明的技术。
用户通过输入/输出装置52与计算机系统50交互。输入/输出装置52可包括显示器54,其配置成以视觉形式向用户展示信息,例如在图2中通过显示器40展示信息。输入/输出装置52也可以包括键盘56或鼠标58。然而,本发明不限于图3中示出的特定输入/输出装置,而是可以包括例如触摸屏、记录笔、触摸垫或者音频输入/输出装置的输入/输出装置。
计算机系统50包括执行翻译软件的处理器60。翻译软件,其可以存储在存储器62中,可以是任意几个商业可得的翻译包。存储器62可以包括任意形式的信息存储。存储器62可包括随机存取存储器,也可以包括任意多种计算机可读介质,其含有引起可编程处理器(例如处理器60)执行在此所述技术的指令。这样的计算机可读介质包括,但不限于,磁和光存储介质,以及只读存储器,例如处理器60可访问的可擦写可编程只读存储器或者闪存。
存储器62进一步可以存储相关电子文档,例如幻灯片、页面、章节等等。
典型的翻译软件包包括可将文本从源语言翻译成目标语言的翻译引擎64。本发明也包含这样的实施例,其中翻译引擎64体现为硬件、固件或者硬件、固件和软件的任意组合。
典型的翻译引擎64可以使用一个或多个专门的翻译工具,以将消息从源语言转化为目标语言。专门的翻译工具可以包括通常处理专用术语的一个或多个术语管理器66、翻译存储器工具68和/或机器翻译工具70。翻译存储器工具68通常通过识别以前翻译的词和短语而减少了翻译努力,其不需要“从零开始”翻译。机器翻译工具70例如通过解析消息以及分析词或短语而从语言学上“从零开始”处理源语言的消息。术语管理器66、翻译存储器工具68和/或机器翻译工具70在商业上可从不同的几个公司获得。本发明包括了多种翻译引擎,不限于特定的翻译引擎或者任意特定专门的翻译工具。
在典型的实施中,计算机系统50在使用翻译引擎“从零开始”翻译词或短语之前查阅存储在存储器62中的短语。存储器62可以包括一个或多个词短语的分类,所述分类可以根据例如使用频率和主题领域的标准而用层级来排列。翻译存储器工具68可以进一步支持搜索算法,所述算法匹配或者试图匹配所需的短语与已经在存储器62中的表述。
在许多情况下,优选翻译引擎64采用翻译存储器工具68来使用在存储器62中的已有表述,而不是使用机器翻译工具70。通常,存储器62中的短语被认为比“从零开始”执行的翻译更加可靠且更接近于想要得到的含义。
在一些情况下,翻译引擎64可遇到不确定性,例如具有多种翻译的词或短语。本发明支持“学习模式”,在该模式中存储器62存储了有关词或短语的用户以前翻译的信息。在一个实施例中,翻译引擎64可以自动选择用户以前选择的翻译。在另一个实施例中,翻译引擎64根据用户以前选择的翻译将可能的含义排序。
虽然计算机系统50被描述为单机(stand-alone)系统,但是本发明也包括不是单机的实施例。例如,本发明包括输入/输出装置52被包含在本地工作站中,且处理器60和/或存储器62是远程的实施例。用户可以通过网络(未示出),例如因特网、移动电话网络、局域网或者无线网,而访问远程处理器60和/或存储器62。
图4的流程图示出了首字母缩写词扩展器的示例操作。在翻译文本的过程中(80),翻译引擎可识别潜在的首字母缩写词(82)。潜在的首字母缩写词可被唯一地识别为首字母缩写词。例如术语“USA”可以被识别为美国。术语“CO”可以被识别为,列举几个例子,“公司”的潜在缩写或者代表“一氧化碳”或“心脏输出”的首字母缩写词。术语“AIDS”可以是首字母缩写词或者与“助手”或“资源”或“有帮助的行动”同义的普通词。当翻译引擎第一次遇到潜在的首字母缩写词时,翻译引擎可扩展首字母缩写词,列出所知道的含义。
处理器可询问用户(86)关于正被考虑的源文本的方面。尤其是,处理器可询问用户关于潜在首字母缩写词的想要含义。处理器可提供扩展的首字母缩写词给用户作为正被考虑术语的可能含义之一。处理器通过一个或多个输入/输出装置提出询问并且接收来自用户的响应(88)。来自用户的响应反映了想要的含义。处理器作为用户响应的函数(as a function of the user’s response)继续进行翻译并且映射翻译到目标文档(90)。
在一些情况下,翻译本身可能是首字母缩写词。例如,英语首字母缩写词“AIDS”翻译成西班牙语首字母缩写词“SIDA”。用户也可以选择正被考虑的首字母缩写词的扩展版本。例如当处理器遇到首字母缩写词“USA”时,处理器可以展示给用户首字母缩写词翻译“E.E.U.U.”或例如“Estados Unidos”的扩展翻译的选择。
用户对询问作出响应(88)后,处理器可以在存储器中存储词和/或短语(92)。翻译装置,例如图3中的计算机系统50,通常在存储器中包括词汇表的词和短语的数据库,并且术语可以被加进数据库。如果处理器后来在相同的文档中或者在相关的电子文档中遇到相同的首字母缩写词、词或短语,处理器可以继续进行相同的翻译,而不用再次询问用户。
用户可以对将新首字母缩写词、词或短语永久性地或暂时性地加入存储器具有判断力。新术语暂时加入到存储器使得翻译适用于一组中的相关电子文档,但对其它组中的电子文档不适用。在关于健康问题的一组电子幻灯片中,例如,术语“AIDS”可以一致地被翻译为“SIDA”。然而,在关于军队命令结构的一组电子幻灯片中,使用“SIDA”将是不合适的,使用其它术语例如“asistentes”(“助手”)可能是合适的。因此,当翻译一组新的相关电子文档时,处理器可再次询问用户关于术语的翻译,即使术语在翻译先前组的相关电子文档期间是询问的主题。
用户也可以对指定首字母缩写词的新扩展具有判断力。在关于信息分布的一组相关电子文档中,“AIDS”可代表“自动化信息分布系统”。用户可以对将新扩展及其翻译永久性或暂时性加入到存储器中具有判断力。
图5的流程图示出了对一组相关电子文档的翻译。从存储器加载源文档(100)后,处理器将源文档中的对象映射到目标文档(102)。例如,处理器从源文档复制图形元素到目标文档。处理器也注意到了要翻译的文本的位置、大小、字体、风格和其它特征。处理器为用户展示源文档和目标文档或者其中的部分(104)。在示例实施例中,处理器并排显示源文档和目标文档,如图2中所示。
处理器用翻译引擎64中的工具翻译文本(106)。如上面所述,翻译(106)可包括搜索存储在存储器62中的类似表述,或者“从零开始”翻译,或者两种都有。在某点,翻译引擎可遇到影响翻译的不确定性(108)。不确定性可包括上面结合图4讨论的首字母缩写词,或者可包括其它事情,其中想要的含义不清晰。
当处理器遇到不确定性的情况,处理器确定是否该不确定性在以前的时候遇到过或者是否用户通过对询问响应已解决了该不确定性(110)。当用户已经解决了不确定性时,处理器没有必要再次询问用户,而是根据用户以前的响应解决该不确定性(112)。处理器作为用户以前解决不确定性的函数继续进行翻译并且映射翻译到目标文档中(114)。在变体中,处理器展示给用户可能含义的列表。含义的列表可以是排序的,使最先展示的是最高频率或者最大可能的含义。处理器询问用户想要的含义并且作为用户响应的函数映射翻译到目标文档中。
映射翻译到目标文档中包括根据源文本的格式特征映射目标文本到目标文档,从而保留了源文本的至少一个或多个格式特征。在一些情况下,映射可以包括改变一个或多个格式特征,例如为目标文本选择更小的大小或者不同的字体。
当用户没有解决不确定性时,处理器询问用户关于源文本的方面(116),接收用户对询问的响应(118),并且作为用户响应的函数继续进行翻译和映射(114)。目标文本通常以源文本的相同大小、字体、风格和其它格式特征而展示在与源文本相同的位置。然而,映射可包括改变目标文本的一个或多个格式特征。
如上所述,当翻译引擎遇到潜在的首字母缩写词时可以使用绕过用户询问的处理。然而,图5所示出的处理并不限于应用到首字母缩写词。例如,口语和比喻可给翻译引擎产生不确定性。例如,如果翻译引擎遇到句子“Hold the phone”,翻译引擎就可能不能确定该句子是抓住一个电话设备的字面命令,还是等一会的比喻命令。假如,在询问之后,用户响应比喻的理解是想要的,那么当处理器在相关电子文档中遇到句子“Hold the phone”时,处理器可以使用比喻的理解而不用询问。
关于图1中所示出的示例源幻灯片12A和14A,翻译引擎在第一次遇到“AIDS”时可能已询问过用户。在接收到用户的响应首字母缩写词“SIDA”是正确的翻译后,处理器可将这个翻译应用到该组其它幻灯片中的其它“AIDS”的情况。
除了以前的首字母缩写词处理,该发明可提供一个或多个其它优点。本发明可以用很少的命令翻译一组相关电子文档。可以应用于电子幻灯片的相同技术也可以使用于电子表格的单元、电子表格组、书本的页面、一组收集的文本文件和一组包括文本的图。然而本发明不限于这些应用。
另外,本发明的技术减少了用户和翻译装置之间的交互。尤其是,一旦用户被询问过首字母缩写词或者不确定的术语,假如首字母缩写词或者术语在该组相关的电子文档中再次遇到则用户不必被询问。因此本发明可以导致更快的翻译并且提高使用的简易性。
本发明也保留了图形和文本的属性。结果,目标文档可具有与源文档相同的“外观和感觉”。保留外观和感觉具有美学的益处,因为花费在使原始的源幻灯片有吸引力的努力延续到目标幻灯片。也有许多实际的益处。例如,在翻译器的帮助下对西班牙语听众做PowerPoint展示的英语演讲者,可以展示相应于熟悉的英语PowerPoint幻灯片的西班牙语PowerPoint幻灯片。演讲者熟悉英语的幻灯片允许演讲者也多少熟悉西班牙语幻灯片,从而给了演讲者提供了协调较好的多语言展示的机会。
上面已经描述了本发明的几个实施例。在一些实施例中,本发明可用于任何数量的源语言和目标语言,并且可以通过多种翻译装置执行。翻译装置也可以包括在此没有提到的性能,例如语音识别或者声音合成。
另外,本发明并不限于包括图形的相关电子文档。本发明可以应用于包括格式化文本的电子文档。本发明可以加载源文档和映射翻译文本到目标文档,而目标文档合并了源文档的一个或多个格式特征。文本的位置、文本的对齐、文本是否为黑体或者斜体或者带下划线的、文本的字体、文本是否全为大写等等都是本发明可以保留的格式特征。
本发明也包括保留比所有格式特征少一些格式特征的实施例。例如,在一个实施例中,源语言是英语而目标语言是韩语,语言的字符集是不同的。例如,保留源文本的字体可能不需要或不可行。在其它实施例中,可以改变例如文本大小的格式特征以适应翻译。
另外,本发明包括一些实施例,其包含任意不同种计算机可读介质,该计算机可读介质包含引起可编程处理器(例如处理器60)执行在此描述的技术的指令。这样的计算机可读介质包括但不限于磁和光存储介质,以及只读存储器,例如可擦除可编程只读存储器或闪存。
权利要求
1.一种方法,包括展示源文档给用户,源文档包括源语言的源文本和至少一个图形元素;映射图形元素到目标文档;通过将源文本翻译为目标语言生成目标文本;以及映射目标文本到目标文档。
2.根据权利要求1的方法,其中源文本定义了格式特征,并且其中映射目标文本到目标文档包括根据源文本的格式特征映射目标文本到目标文档。
3.根据权利要求2的方法,其中格式特征包括源文本大小、源文本在源文档中位置和源文本字体的至少其中一种。
4.根据权利要求1的方法,进一步包括同时展示给用户源文档和目标文档。
5.根据权利要求1的方法,进一步包括询问用户关于源文本的方面;接收用户的对询问的响应;以及至少部分地基于响应将源文本翻译为目标语言。
6.根据权利要求5的方法,进一步包括识别源文本中潜在的首字母缩写词;以及扩展首字母缩写词,其中询问用户关于源文本的方面包括询问用户关于潜在首字母缩写词的想要含义。
7.根据权利要求1的方法,进一步包括识别源文本中的不确定性;确定用户是否以前对解决该不确定性的询问作出过响应;以及至少部分地基于以前的响应将源文本翻译为目标语言。
8.根据权利要求7的方法,其中源文档是第一源文档,源文本是第一源文本,以及其中确定用户是否以前对解决该不确定性的询问作出过响应包括确定用户是否以前在包括于第二源文档中的第二源文本中对解决该不确定性的询问作出过响应。
9.根据权利要求7的方法,其中不确定性包括关于潜在首字母缩写词的想要含义的不确定性。
10.根据权利要求7的方法,进一步包括识别源文本中不确定性的第二情况;以及第二次询问用户关于不确定性,其中第二次询问用户包括展示作为响应的函数而排序的含义列表。
11.一种计算机可读介质,包括引起可编程处理器执行权利要求1-10的方法中的任意一个的指令。
12.一种配置成执行权利要求1-10的方法中的任意一个的系统,其包括显示器,其配置成展示给用户包括源语言的源文本的源文档,同时展示给用户包括目标语言的目标文本的目标文档;以及处理器,其配置成将源文本翻译为目标文本,进一步配置为根据源文本的格式特征将目标文本映射至目标文档。
13.根据权利要求12的系统,其中处理器进一步配置为询问用户关于源文本中不确定性的情况,接收用户对于询问的响应,以及至少部分地基于响应将源文本翻译为目标文本。
14.根据权利要求13的系统,进一步包括存储器,以作为响应的函数而存储不确定性的解决。
全文摘要
通常,本发明涉及文本翻译工具,其对于翻译相关的电子文档尤其有用。相关的电子文档是指彼此相关的电子形式的任意文档,例如电子幻灯片、电子表格条目、书本的页面、一组收集的文本文件、一组包括文本的图等等。本发明提供将来自于源语言源文档的源文本翻译成目标语言的目标文本。本发明进一步提供根据源文本的一个或多个格式特征映射目标文本到目标文档。结果,目标文档保留了源文档的一些“外观和感觉”。在包括一个或多个图形元素的源文档中,本发明支持映射图形元素到目标文档。
文档编号G06F17/28GK1894685SQ200480037831
公开日2007年1月10日 申请日期2004年12月16日 优先权日2003年12月17日
发明者R·D·帕姆奎斯特 申请人:思比驰盖尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1