用于通过在语言之间执行翻译来支持交流的交流支持设备和方法

文档序号:6557890阅读:209来源:国知局
专利名称:用于通过在语言之间执行翻译来支持交流的交流支持设备和方法
技术领域
本发明涉及用于通过在多种语言之间执行翻译来支持交流的交流支持设备、交流支持方法和计算机程序产品。
背景技术
近些年来,随着自然语言处理技术的发展,用于将例如用日语书写的文本翻译为另一种语言(例如英语)的文本的机器翻译系统已经投入实用并广泛流行。
随着语音处理技术的发展,同样已经使用了语音听写系统以及语音合成系统,在语音听写系统中,通过将用户所说的句子转换为文字从而使得能够通过语音来输入自然语言字符串,所述语音合成系统用于将作为电子数据获取的句子和从系统输出的自然语言字符串转换为语音输出。
随着图像处理技术的发展,已经实现了字符识别系统,在该系统中,通过分析用照相机等拍摄的字符图像将图像中的句子转换为机器可读的字符数据。此外,随着手写字符技术的发展,已经实现了将用户用笔式(pen-based)输入设备手写输入的句子转换为机器可读字符数据的技术。
随着文化和经济的全球化,以不同语言为母语的人之间的交流机会在增加。因此,对应用于交流支持设备的技术的期望提高增长了,所述交流支持设备通过集成自然语言处理技术、语音处理技术、图像处理技术、手写字符识别技术来支持以不同语言为母语的人之间的交流。
作为这样的设备,可以考虑如下的交流支持设备。首先,利用语音识别技术或者手写字符识别技术将讲日语的人所说的或者通过笔所输入的日语句子转换为机器可读的日语字符数据。接着,使用机器翻译技术将所述数据翻译为语义等价的英语句子,并且将结果呈现为英语字符串。或者,利用语音合成技术将结果以英语语音的形式呈现给讲英语的人。另一方面,对讲英语的人所说的或者通过笔输入的英语句子进行相反的处理,从而向讲日语的人呈现翻译完的日语句子。通过这种方法,试图实现能够使得在母语为不同语言的人之间进行双向交流的交流支持设备。
此外,作为另一个例子,可以考虑如下的交流支持设备。首先,用照相机拍摄用英语表达的本地标记的字符串、警示陈述等。接着,利用图像处理技术和字符识别技术将所拍摄的字符串转换为机器可读的英语字符串数据。进一步使用机器翻译技术将所述数据翻译为语义等价的日语句子,并将日语字符串结果呈现给用户。或者,利用语音合成技术将结果以日语语音的形式呈现给用户。通过这种方法,已经尝试了实现一种交流支持设备,通过使用该设备,在讲英语的地区旅游的、不懂英语的讲日语的旅游者可以理解英语表达的标记和警示陈述。
在这种交流支持设备中,当通过语音识别处理、手写字符识别处理、或者图像字符识别处理识别由用户输入的、将被转换为机器可读的字符数据的源语言的输入句子时,难于获取没有错误的正确的候选,并且通常出现由获取了多个候选解释而导致的歧义。
在机器翻译处理中,因为当将源语言句子转换为语义等价的目标语言句子时也会出现歧义,所以存在多个目标语言句子的候选。因此,在很多情况下,不能唯一地选择语义等价的目标句子并且不能消除歧义。
可以考虑以下原因,例如一种情况是,其中,源语言句子自身是存在多个解释的歧义表达;一种情况是,因为源语言句子自身是高度依赖于上下文的表达,所以会出现多个解释;还有一种情况是,因为源语言和目标语言的语言和文化背景、概念系统等不同,所以出现多个候选翻译。
为了消除这些歧义,当获取多个候选时,提出了选择所获取的第一个候选的方法,以及将多个候选呈现给用户以便用户在他们之中作出选择的方法。还提出了一种方法,其中,当获取了多个候选时,根据一些标准为各个候选打分以选择具有最高分的候选。例如,在日本专利申请特开平(JP-A)No.H07-334506中,提出了一种技术,其中,从多个由翻译产生的译出的单词中选择一个译出的单词,使得从该单词能想起的概念的相似度最高,从而提高译句的质量。
但是,选择所获取的第一个候选的方法虽然能缩短处理时间,却不能保证选择最优的候选,并且很可能输出与源语言句子的内涵不匹配的目标语言句子。
用户在多个候选中做出选择的方法增加了用户的负担,并且在获取多个候选解释时不能有效地呈现给用户。此外,还存在一个问题,即,即使用户可以正确地选择源语言的候选解释,也不能消除在进行后续翻译处理时引起的歧义,并且还有一个问题在于,即使为了消除这些歧义,指定由用户选择翻译处理结果,但是因为用户通常不理解目标语言,所以这也不是一个有效的方法。
在JP-A No.H07-334506的方法中,因为用户不选择所翻译的候选句子,而是基于根据概念相似性的标准计算的值来选择候选译句,所以降低了用户的负担。但是,有一个问题,即,因为难以设置作为打分依据的标准,所以不能保证选择最优的候选,并且可能会选择与源语言句子的含义不匹配的目标语言句子。

发明内容
根据本发明的一个方面,一种交流支持设备包括分析单元,用于分析将被翻译为目标语言的源语言句子,并输出至少一个作为源语言句子的解释的候选的候选源语言解释;检测单元,用于当存在多个候选源语言解释时,检测歧义部分,该歧义部分是多个候选源语言解释中的各个候选之间的不同部分;翻译单元,用于将除歧义部分之外的候选源语言解释翻译为目标语言。
根据本发明的另一个方面,一种交流支持设备包括分析单元,用于分析将被翻译为目标语言的源语言句子,并输出至少一个作为源语言句子的解释的候选的候选源语言解释;翻译单元,用于将候选源语言解释翻译为目标语言,并输出至少一个作为以目标语言描述的解释的候选的候选目标语言解释;检测单元,用于当存在多个候选目标语言解释时,检测歧义部分,该歧义部分是多个候选目标语言解释中的各个候选之间的不同部分;以及生成单元,用于基于除歧义部分之外的候选目标语言解释生成作为用目标语言描述的句子的目标语言句子,并输出至少一个作为目标语言句子的候选的候选目标语言句子。
根据本发明的另一个方面,一种交流支持设备包括分析单元,用于分析将被翻译为目标语言的源语言句子,并输出至少一个作为源语言句子的解释的候选的候选源语言解释;翻译单元,用于将候选源语言解释翻译为目标语言,并输出至少一个作为以目标语言描述的解释的候选的候选目标语言解释;生成单元,用于基于候选目标语言解释生成作为用目标语言描述的句子的目标语言句子,并输出至少一个作为目标语言句子的候选的候选目标语言句子;检测单元,用于当存在多个候选目标语言句子时,检测歧义部分,该歧义部分是多个候选目标语言句子中的各个候选之间的不同部分;以及删除单元,用于删除歧义部分。
根据本发明的另一个方面,一种交流支持设备包括分析单元,用于分析将被翻译为目标语言的源语言句子,并输出至少一个作为源语言句子的解释的候选的候选源语言解释;检测单元,用于当存在多个候选源语言解释时,检测歧义部分,该歧义部分是多个候选源语言解释中的各个候选之间的不同部分;平行翻译对存储单元,用于存储由语义上相互等价的候选源语言解释和候选目标语言句子组成的平行翻译对;以及选择单元,用于根据除歧义部分之外的候选源语言解释和存储在平行翻译对存储单元中的平行翻译对来选择候选目标语言句子。
根据本发明的另一个方面,一种交流支持方法包括分析将被翻译为目标语言的源语言句子;输出至少一个作为源语言句子的解释的候选的候选源语言解释;当存在多个候选源语言解释时,检测歧义部分,该歧义部分是多个候选源语言解释中的各个候选之间的不同部分;将除歧义部分之外的候选源语言解释翻译为目标语言。
根据本发明的另一个方面,一种交流支持方法包括分析将被翻译为目标语言的源语言句子;输出至少一个作为源语言句子的解释的候选的候选源语言解释;将候选源语言解释翻译为目标语言;输出至少一个作为以目标语言描述的解释的候选的候选目标语言解释;当存在多个候选目标语言解释时,检测歧义部分,该歧义部分是多个候选目标语言解释中的各个候选之间的不同部分;基于除歧义部分以外的候选目标语言解释,生成作为用目标语言描述的句子的目标语言句子;输出至少一个作为目标语言句子的候选的候选目标语言句子。
根据本发明的另一个方面,一种交流支持方法包括分析将被翻译为目标语言的源语言句子;输出至少一个作为源语言句子的解释的候选的候选源语言解释;将候选源语言解释翻译为目标语言;输出至少一个作为以目标语言描述的解释的候选的候选目标语言解释;基于候选目标语言解释生成作为用目标语言描述的句子的目标语言句子;输出至少一个作为目标语言句子的候选的候选目标语言句子;当存在多个候选目标语言句子时,检测歧义部分,该歧义部分是多个候选目标语言句子中的各个候选之间的不同部分;以及删除歧义部分。


图1是显示根据第一实施例的交流支持设备的配置的框图;图2是显示第一实施例中的交流支持处理的总体过程的流程图;图3是显示歧义部分排除处理的总体过程的流程图;图4显示了在根据第一实施例的交流支持设备中处理的数据的实例;图5显示了由源语言语音识别单元输出的源语言句子的实例;图6A到6F显示了由源语言分析单元输出的候选源语言解释的实例;图7A到7F显示了由翻译单元输出的候选目标语言解释的实例;图8显示了由目标语言生成单元输出的候选目标语言句子的实例;
图9A到9C显示了由歧义部分检测单元检测的歧义部分的实例;图10A到10C显示了通过在歧义部分检测单元中删除歧义部分所得到的结果的实例;图11显示了由第一实施例中的交流支持处理所处理的数据的流程的实例;图12是显示由译出部分呈现单元显示的译出部分显示屏幕的实例的说明视图;图13是显示根据第二实施例的交流支持设备的配置的框图;图14是显示概念层次存储单元的数据结构的实例的说明视图;图15是显示根据第二实施例的歧义部分排除处理的总体过程的流程图;图16是显示由源语言语音识别单元所输出的源语言句子的实例的说明视图;图17是显示由源语言分析单元输出的候选源语言解释的实例的说明视图;图18A到18B显示了由翻译单元输出的候选目标语言解释的实例;图19显示了由目标语言生成单元输出的候选目标语言句子的实例;图20显示了由歧义部分检测单元检测到的歧义部分的实例;图21显示了在概念替换单元中通过将歧义部分替换为上位概念所得到的结果的实例;图22显示了第二实施例中的交流支持处理所处理的数据的流程的实例;以及图23是显示由译出部分呈现单元显示的译出部分显示屏幕的实例的说明视图。
具体实施例方式
下面参照附图详细描述根据本发明的交流支持设备、交流支持方法、以及计算机程序产品的典型实施例。
根据第一实施例的交流支持设备解释从语音中识别出的源语言句子的语义内容,将所解释的以源语言描述的语义内容翻译为以目标语言描述的语义内容,根据翻译出的以目标语言表示的语义内容生成目标语言句子,以及根据生成的目标语言句子合成并输出目标语言语音。这时,如果在语音识别处理、源语言分析处理、翻译处理、以及目标语言生成处理的处理结果中得到了多个候选,则检测各个候选之间的差别并作为歧义部分删除,从而消除最终输出的目标语言句子的歧义。
这里,源语言句子是指用源语言(待翻译的源语言)表达的字符串,目标语言句子是指用目标语言(将被翻译成的语言)表达的字符串。源语言句子和目标语言句子都不局限于带有句号的句子,可以是句子、段落、短语、单词等。
此外,虽然在第一实施例中,说明了将通过用户的语音输入的日语翻译为英语并输出为语音的交流支持设备作为实例,但是源语言和目标语言的组合不局限于此,本发明可以应用于任意组合,只要是将源语言翻译成一个不同的语言。
图1是显示根据第一实施例的交流支持设备100的配置的框图。如图1所示,交流支持设备100包括源语言语音识别单元101、源语言分析单元102、翻译单元103、目标语言生成单元104、目标语言语音合成单元105、歧义部分检测单元106、歧义部分删除单元107、译出部分呈现单元108、以及对应信息存储单元110。
源语言语音识别单元101接收用户发出的源语言语音,并执行语音识别处理从而输出转录了语音内容的候选源语言句子。任何常用的使用线性预测系数(Linear Predictive Coefficient)分析、隐马尔可夫模型(Hidden Markov Model,HMM)、动态规划(dynamicprogramming)、神经网络(neural network)、N-元语法语言模型(N-Gram language model)等的语音识别方法都可以应用于由源语言语音识别单元101执行的语音识别处理。
源语言分析单元102接收由源语言语音识别单元101识别出的源语言句子,并参考源语言的词汇信息和语法规则来执行自然语言分析处理,例如形态分析、句法分析、依赖分析、语义分析、上下文分析,从而输出作为源语言句子所表示的语义内容的解释的候选的候选源语言解释。此外,源语言分析单元102输出源语言句子和候选源语言解释之间的对应关系作为解释对应信息。
通过自然语言分析处理所获取的单个候选源语言解释是一种表示源语言句子的语法结构和概念之间的依赖关系的树结构图,其中,使对应于源语言词汇的概念表示为节点。因此,解释对应信息存储如下信息,其中,源语言句子中包含的部分字符串与标识树结构图中的每个节点的数字(节点标识号)相关联。
任何常用的方法都可以应用于源语言分析单元102所执行的自然语言分析处理,例如使用CYK算法的形态分析和使用Earley算法、Chart算法、或广义LR(generalized left to right)分析的句法分析。此外,将包含了形态信息、语法信息、语义信息等信息的用于自然语言处理的词典存储在常用的存储器中,例如硬盘驱动器(HDD)、光盘、存储卡等等,并且在自然语言分析处理中参考。
翻译单元103接收源语言分析单元102输出的候选源语言解释,并根据源语言和目标语言的词汇信息、用于消减两种语言之间结构差别的结构转换规则以及表示两种语言的词汇之间的对应关系的平行翻译词典,输出候选目标语言解释。此外,翻译单元103输出候选源语言解释和候选目标语言解释之间的对应关系作为翻译对应信息。
通过翻译处理所获取的候选目标语言解释是用英语(目标语言)表示的内在表达的候选。与候选源语言解释相似,候选目标语言解释是一种表示将要翻译成的目标语言句子的句法结构和概念之间的依赖关系的树结构图,其中,使对应于源语言词汇的概念表示为节点。因此,翻译对应信息存储如下信息,其中,代表候选源语言解释的树结构图的节点标识号与代表候选目标语言解释的树结构图中的节点标识号一一对应。任何常规的转换方法中利用的方法都可以应用于翻译单元103所执行的翻译处理。
目标语言生成单元104接收由翻译单元103输出的候选目标语言解释,并根据词汇信息和定义目标语言英语的语法结构的语法规则等输出候选目标语言句子。此外,目标语言生成单元104输出候选目标语言解释和候选目标语言句子之间的对应关系作为生成对应信息。生成对应信息存储如下信息,其中,代表候选目标语言解释的树结构图的节点标识号与候选目标语言句子中包含的部分字符串一一对应。任何常用的语言生成方法都可以应用于这里执行的目标语言生成处理。
目标语言语音合成单元105接收由目标语言生成单元104输出的目标语言句子,并输出作为目标语言英语的合成语音的内容。任何常用的方法都可以应用于这里执行的语音合成处理,例如使用语音片编辑和语音合成、共振峰语音合成等的文本到语音的系统。
如果存在多个由源语言语音识别单元101输出的候选源语言句子、多个由源语言分析单元102输出的候选源语言解释、多个由翻译单元103输出的候选目标语言解释、或者多个由目标语言生成单元104输出的候选目标语言句子,则歧义部分检测单元106检测并输出多个候选之间的差异部分作为歧义部分。
歧义部分删除单元107从候选源语言句子、或候选源语言解释、或候选目标语言解释、或候选目标语言句子中删除由歧义部分检测单元106输出的歧义部分。从而多个候选可以被合成为一个不包含歧义部分的候选。
译出部分呈现单元108通过顺序地参考由源语言分析单元102输出的解释对应信息、由翻译单元103输出的翻译对应信息以及由目标语言生成单元104输出的生成对应信息,来识别源语言句子中对应于最终译出的目标语言句子的部分的字符串(以下称为译出部分),并且执行屏幕显示等从而反馈给用户。
对应信息存储单元110是存储解释对应信息、翻译对应信息以及生成对应信息的存储器,可以由任何常用的存储器组成,例如HDD、光盘和存储卡。当译出部分呈现单元108识别译出部分时参考存储在对应信息存储单元110中的解释对应信息、翻译对应信息以及生成对应信息。
接下来,说明根据如上配置的第一实施例的交流支持设备100所执行的交流支持处理。图2是显示第一实施例中的交流支持处理的总体过程的流程图。
源语言语音识别单元101首先接收用户发出的源语言语音的输入(步骤S201),对所接收的源语言语音执行语音识别处理,并输出源语言句子(步骤S202)。
接着,源语言分析单元102分析由源语言语音识别单元101输出的源语言句子,并输出候选源语言解释,同时,将解释对应信息输出到对应信息存储单元110(步骤S203)。更具体地,执行一般的自然语言分析处理,例如形态分析、句法分析、语义分析以及上下文分析等,并输出带有由树结构图表示的各个语素之间的关系的候选源语言解释。
例如,假设识别出发音为“ASUKURUMADEMATSU”的日语语,并且当其被翻译为英语时,可以解释为“I will wait until you comtomorrow”和“I will wait in the car tomorrow”,因此,输入了图4所示的日语句子401作为源语言句子。在这种情况下,输出两个候选源语言解释一个是具有三个作为树结构图的节点的节点402、403和404的候选,另一个是具有三个作为树结构图的节点的节点405、406和407的候选。也就是说,在这种情况下,显示了一个例子,其中,通过形态分析,由于为句子加的逗号的位置的差别,作为源语言句子的一部分的日语408被以两种方式解释为日语409和日语410,并且因此输出了两个候选源语言解释。
这里,每个节点以“<概念标签>@<节点标识号>”的格式来表示。概念标签包括指示主要对应于名词的“对象”或“事件”(例如“明天”或“车”)的标签、指示主要对应于动词的“动作”或“现象”(例如“等待”和“购买”)的标签、以及指示主要对应于辅助动词的“意图”或“状态”(例如“问”、“希望”和“不可行”)的标签。此外,节点标识号是唯一标识每个节点的号码。
在步骤S203输出候选源语言解释之后,执行歧义部分排除处理,其该处理中,从多个候选源语言解释中删除歧义部分,以输出一个候选源语言解释(步骤S204)。下文中描述歧义部分排除处理的细节。
图3是显示歧义部分排除处理的总体过程的流程图。在歧义部分排除处理中,歧义部分检测单元106首先确定是否有多个候选输出(步骤S301)。如果不存在多个候选(步骤S301否),则不存在歧义部分,所以结束歧义部分排除处理。
如果存在多个候选(步骤S301是),则歧义部分检测单元106检测多个候选之间的差别作为歧义部分(步骤S302)。例如,在所述例子中(日语句子401),日语408被检测为歧义部分。
接着,歧义部分删除单元107删除由歧义部分检测单元106检测到的歧义部分,从而将多个候选集成为一个候选并输出(步骤S303),从而结束歧义部分排除处理。例如,在所述例子中(日语句子401),输出具有作为树结构图的两个节点的日语411和日语412的候选,作为候选源语言解释,其中删除了日语408。
在步骤204的关于候选源语言解释的歧义部分排除处理结束之后,翻译单元103翻译排除了歧义部分的候选源语言解释,并输出候选目标语言解释,与此同时,输出翻译对应信息到对应信息存储单元110(步骤S205)。例如,对于具有日语411和日语412作为树结构图的两个节点的候选源语言解释,输出具有“TOMORROW”和“WAIT”作为树结构图的两个节点的候选目标语言解释。
接着,执行关于候选目标语言解释的歧义部分排除处理(步骤S206)。这里,因为处理过程中的不同点仅仅是对候选目标语言解释执行歧义部分排除处理,而不是对候选源语言解释执行,并且处理内容相同,因此不再重复其描述。在所述例子中,在候选目标语言解释中不存在歧义,所以不执行歧义部分的删除处理并且结束歧义部分排除处理结束(步骤S301否)。
在对候选目标语言解释执行歧义部分排除处理之后(步骤S206),目标语言生成单元104根据候选目标语言解释生成目标语言句子,与此同时,将生成对应信息输出到对应信息存储单元110(步骤S207)。例如,根据具有“TOMORROW”和“WAIT”作为树结构图的两个节点的候选目标语言解释生成目标语言句子“I will wait,tomorrow”。
在这种方式下,根据目标语言英语的语法和词汇知识,目标语言生成单元104按照英语安排格式,并根据需要补充在原始的作为源语言的日语文本中省略的主语等,从而输出呈现了候选目标语言解释的内容的英语表层文本(surface text)作为目标语言句子。
接着,译出部分呈现单元108通过顺序地参考存储在对应信息存储单元110中的解释对应信息、翻译对应信息以及生成对应信息,获取对应于由目标语言生成单元104生成的目标语言句子的译出部分,并通过屏幕显示呈现给用户(步骤S208)。这是为了使用户容易地知道哪部分包含在源语言句子中的部分字符串已被翻译并作为目标语言句子输出。这种方式的配置使用户能知道通过翻译删除了哪部分,并在之后的对话中对其进行补充等等,因此能够有效地执行对交流的支持。稍后描述用于呈现译出部分的屏幕显示(译出部分显示屏幕)的例子。
接着,目标语言语音合成单元105根据目标语言句子合成目标语言的语音以输出(步骤S209),并且结束交流支持处理。由于有屏幕显示,所以如果用户决定不执行语音输出,则可以不由目标语言语音合成单元105执行语音合成处理,但处理可以返回到语音识别处理以便再次输入。
此外,虽然只对候选源语言解释和候选目标语言解释执行了歧义部分排除处理,但是当存在多个由源语言语音识别单元101输出的源语言句子时,或者当存在多个由目标语言生成单元104输出的候选目标语言句子时,可以使用一种配置,其中,以与前述方式相似的方式来执行歧义部分排除处理。在这种情况下,可以利用一种配置,其中,利用以格子(lattice)等表达的源语言语音识别单元101的输出结果来执行歧义部分排除处理。也就是说,歧义部分排除处理可以应用于任何处理,只要在处理过程中输出了多个处理结果并且它们之间的差别部分可以被检测为歧义部分。
接下来,描述根据第一实施例的交流支持设备100中的交流支持处理的具体例子。
图5显示了由源语言语音识别单元101输出的源语言句子的例子。如图5所示,考虑三个例子,其中,源语言句子S1、源语言句子S2以及源语言句子S3分别作为源语言句子被输入。
图6A到6F显示了由源语言分析单元102输出的候选源语言解释的例子。如图6A到6F所示,源语言分析单元102输出候选源语言解释T1a和T1b、T2a和T2b、T3a和T3b,分别对应于源语言句子S1、S2和S3。
候选源语言解释由如上所述的树结构图表示,树结构图的每个节点以<概念标签>@<标识号>的格式来表示。此外,连接候选解释的树结构图的各个节点的弧指示了各个节点之间的语义关系,以“$<关系标签>$”的格式来表示弧。关系标签包括的语义关系例如$TIME$(时间)、$LOCATION$(地点)、$UNTIL$(时间的前后关系)、$BACKGROUND$(背景)、$OBJECT$(对象)、$ACTION$(行为)、$REASON$(原因)、$TYPE$(种类)等。关系标签不局限于此,可以包括任何指示节点之间的语义关系的关系。
在图6A到6F中,显示了多个例子,在每个例子中,由源语言分析单元102输出两个候选源语言。在形态分析中,以两种方式解释T1a和T1b的例子。
T2a和T2b的例子是在语义分析或上下文分析中产生的多个解释的例子,语义分析或上下文分析用于分析节点之间的语义关系和语音意图。
T3a和T3b的例子是在语义分析中产生多个解释的例子。
图7A到7F显示由翻译单元103输出的候选目标语言解释的例子。如图7A到7F所示,翻译单元103输出候选目标语言解释U1a和U1b、U2a和U2b、U3a和U3b,分别对应于候选源语言解释T1a和T1b、T2a和T2b、T3a和T3b。
每个候选目标语言解释都是一个与候选源语言解释类似的树结构图,每个节点指示一个目标语言的概念,以“<概念标签>@<节点标识号>”的格式来表示。候选目标语言解释的每个弧的标记和含义与候选源语言解释的每个弧的标记和含义类似。
例如,在图7A到7F所示的例子中,U1a表示在时间“TOMORROW”($TIME$)、地点“CAR”($LOCATION$)执行动作“WAIT”。另一方面,U1b表示在时间“TOMORROW”($TIME$)执行动作“WAIT”,直到现象“COME”($UNTIL$)出现。
此外,U2a表示关于对于对象“COFFEE”($OBJECT$)的动作“BUY”($ACTION$)存在背景“WANT”($BACKGROUND$),并且动作“EXCHANGE”($ACTION$)是在不可行的状态(CANNOT)。另一方面,U2b表示由于对于对象“COFFEE”($OBJECT$)的动作“BUY”($ACTION$)的“WANT”的原因($REASON$),对动作“EXCHANGE”($ACTION$)有“REQUEST”的意图。
此外,U3a表示对作为目标的对象“ROOM”具有“REQUEST”的意图,其价格是“EXPENSIVE”($PRICE$),并且其种类为“OCEANVIEW”($TYPE$)。另一方面,U3b表示对作为目标的对象“ROOM”具有“REQUEST”的意图,其位置为“UPPERFLOOR”($LOCATION$),并且其类型为“OCEANVIEW”($TYPE$)。
每个候选目标语言解释的各个节点是对相应的候选源语言解释的相关节点的源语言概念到目标语言概念的翻译。在图7A到7F所示的例子中,候选源语言解释的树结构图的结构保持不变。然而通常,作为节点之间的连接关系的弧标签或图的结构可以通过翻译处理等被改变,本发明可以应用于这种情况。
图8显示了由目标语言生成单元104输出的候选目标语言的例子。如图8所示,目标语言生成单元104输出候选目标语言句子V1a和V1b、V2a和V2b、V3a和V3b,分别对应于候选目标语言解释U1a和U1b、U2a和U2b、U3a和U3b。此外,最终输出的排除了歧义部分的目标语言句子如Z1、Z2和Z3所示。
图9A到9C显示由歧义部分检测单元106检测到的歧义部分的例子。在图9A到9C所示的例子中,显示了通过在歧义部分检测单元106中检测两个相应候选之间的差别部分作为歧义部分所获得的结果W1、W2和W3,分别对应于图6A到6F中的候选源语言解释T1a和T1b、T2a和T2b、T3a和T3b。图中,歧义部分由粗线和黑体表示,两个候选之间的歧义部分的对应关系由箭头表示。
图10A到10C显示了通过在歧义部分删除单元107中删除歧义部分所获得的结果的例子。在图10A到10C所示的例子中,显示了通过在歧义部分删除单元107中删除相应的歧义部分所获得的结果X1、X2和X3,分别对应于图9A到9C的歧义部分检测结果W1、W2和W3。被删除的歧义部分由虚线表示。
图11显示了第一实施例中的由交流支持处理所处理的数据的流程的例子。在图11中,显示了交流支持处理中的每个源语言句子输入如何获得候选源语言解释和候选目标语言解释,以及最终被输出为目标语言句子。此外,各条数据之间的对应关系由箭头显示。
例如,当输入源语言句子S1时,由源语言分析单元102输出候选源语言解释T1a和T1b,并通过歧义部分检测单元106检测到歧义部分并由歧义部分删除单元107删除歧义部分,从而输出排除了歧义部分的候选源语言解释X1。
此外,翻译单元103对排除了歧义部分的候选源语言解释X1执行翻译处理,并输出排除了歧义部分的候选目标语言解释U1。最后,目标语言生成单元104对排除了歧义部分的候选目标语言解释U1执行目标语言生成处理,输出排除了歧义部分的目标语言句子Z1。
因为对应信息存储单元110存储如图11中箭头所示的各条数据之间的对应信息,所以通过沿着对应关系从最终输出的排除了歧义部分的目标语言句子Z1向源语言句子侧追溯,译出部分呈现单元108可以获得对应于最终译出的目标语言句子Z1的译出部分以在屏幕上显示。
图12A到12C显示了由译出部分呈现单元108显示的译出部分显示屏幕的例子。如图12A到12C所示,译出部分显示屏幕显示了相互关联的作为语音识别的结果的源语言句子、译出部分以及作为翻译结果的目标语言句子。图12A到12C所示的屏幕例子是分别处理图5中的源语言句子的例子S1到S3时的屏幕例子。
例如,图12A中的屏幕例子显示输出日语句子1101作为语音识别的结果,并且执行了歧义排除处理和翻译处理,从而输出了目标语言句子“I will wait,tomorrow”。在这个例子中,在日语句子1101中,因为图4的日语408被作为歧义部分删除,所以仅仅在屏幕上显示日语句子1102作为译出部分。
类似地,在图12B的屏幕例子中,仅仅在屏幕上显示日语句子1112作为译出部分。此外,在图12C的屏幕例子中,仅仅在屏幕上显示日语句子1122作为译出部分。
在这种方式中,译出部分呈现单元108在屏幕上显示译出部分,其使得用户能够以源语言日语确认什么翻译结果被最终传达给对话的另一方。
例如,在有关技术中,如图12C的屏幕例子所示,当不确定是价格高还是楼层高时,任意选择一个,因此有可能错误地传达了希望高价格房间的翻译结果,而事实是希望低价格的房间。但是,根据本发明,通过删除歧义部分并且只保留不包含歧义部分的部分,从而消除了错误地选择与用户意图不匹配的候选的可能性,并且能够向交流的另一方至少传达一个与用户意图匹配的不包含错误的翻译结果。
尽管在第一实施例中,普通的包含三个过程(源语言句子的分析、转换(翻译)为目标语言、以及目标语言句子的生成)的转换方法被描述为用于机器翻译的方法,但是本发明可以应用于任何机器翻译方法,例如基于例子的机器翻译、基于统计的机器翻译、以及中间语言系统机器翻译,只要在相应处理过程的输出结果中产生了歧义。
此外,在第一实施例中,尽管显示了一个例子,其中,执行通过语音识别的源语言句子的输入以及通过语音合成处理的目标语言的输出,但是也可以使用一种配置,其中,通过笔式输入来输入源语言句子并通过屏幕显示来输出目标语言。源语言句子的输入和目标语言的输出不局限于此,可以应用任何普通的方法。
如上所述,在根据第一实施例的交流支持设备中,当在语音识别处理、源语言分析处理、翻译处理、或者目标语言生成处理中获得多个候选处理结果时,通过检测并删除作为歧义部分的各个候选之间的差别部分,能够在没有用户的专门操作的情况下而消除最终输出的目标语言句子的歧义,从而可以获得不包含错误的正确的目标语言句子。
在根据第二实施例的交流支持设备中,当在语音识别处理、源语言分析处理、翻译处理、或者目标语言生成处理中获得多个候选处理结果时,将各个候选之间的差别部分检测为歧义部分,并且当存在所述歧义部分的语义内容的上位概念时,将所述歧义部分替换为所述上位概念从而排除了最终输出的目标语言句子的歧义。
图13是显示根据第二实施例的交流支持设备1200的配置的框图。如图13所示,交流支持设备1200包括源语言语音识别单元101、源语言分析单元102、翻译单元103、目标语言生成单元104、目标语言语音分析单元105、歧义部分检测单元106、歧义部分删除单元107、译出部分呈现单元108、对应信息存储单元110、概念替换单元1209、以及概念层次存储单元1220。
在第二实施例中,新增的概念替换单元1209和概念层次存储单元1220与第一实施例不同。因为其他配置和功能与图1中的对应部分类似,所以给予相同的参考数字和标记并省略对其的说明,其中图1是显示根据第一实施例的交流支持设备100的配置的框图。
概念替换单元1209检索由歧义部分检测单元106检测到的歧义部分的语义内容的上位概念,当能够检索到上位概念时,将歧义部分替换为检索到的上位概念。
概念层次存储单元1220是一个其中预先存储了概念之间的层次关系的存储单元,其可以由任何常用的存储器组成,例如HDD、光盘和存储卡。概念层次存储单元1220用于搜索由歧义部分表示的语义内容的上位概念。
图14是显示概念层次存储单元1220的数据结构的一个例子的说明视图。图14中,每个椭圆中描述的单词表示一个概念。此外,箭头表示位于其起点的概念是位于其终点的概念的上位概念。标记“…”代表省略部分。
例如,图14中描述的内容是,概念“EVENT”、概念“OBJECT”、以及概念“ACTION”是位于最顶层次的概念“CONCEPT”的下位概念,概念“ACCESS”是概念“OBJECT”的下位概念,概念“GATE”和概念“BARRIER”是概念“ACCESS”的下位概念。
接下来,说明根据第二实施例的、如上配置的交流支持设备1200的交流支持处理。在第二实施例中,虽然歧义部分排除处理的细节与其在第一实施例不同,但其它处理与图2中显示的交流支持处理类似,因此不再重复其描述。
图15是显示第二实施例中的歧义部分排除处理的总体过程的流程图。因为从步骤S1401到S1402的歧义部分检测处理与在根据第一实施例的交流支持设备100中的从步骤S301到S302的处理类似,所以不再重复其描述。
在歧义部分检测单元106检测到歧义部分之后(步骤S1402),概念替换单元1209从概念层次存储单元1220中检索歧义部分的上位概念(步骤S1403)。更具体地,概念替换单元1209参照概念层次存储单元1220检测包含了歧义部分中所包括的多个概念的最低层次的上位概念。
例如,假定图14所示的概念层次存储单元1220的数据实例,当概念替换单元1209检索到包含概念“TRUCK”、概念“CAR”和概念“BIKE”的歧义部分的上位概念时,通过检索包含这些概念的最低层次中的概念以输出概念“VIHECLE”。此外,例如当对包含概念“BARRIER”和概念“GATE”的歧义部分检索到上位概念时,概念替换单元1209输出概念“ACCESS”,当对包含概念“BARRIER”和概念“VEHICLE”的歧义部分检索到上位概念时,概念替换单元1209输出概念“OBJECT”。
为了避免过度抽象,可以使用对待检索的上位概念增加限制的配置。例如,该配置可以是,当代表各个概念的节点之间的弧的数目大于预设的数量时,不检索该上位概念。此外,该配置可以是,根据从上位概念开始所到达的层次的不同增加点数,当点数大于预设值时,不检索该上位概念。
接下来,概念替换单元1209确定是否检索到上位概念(步骤S1404)。如果检索到(步骤S1404是),则概念替换单元1209将歧义部分替换为检索到的上位概念,从而将多个候选集成为一个候选(步骤S1405),从而结束所述歧义部分排除处理。
如果没有检索到上位概念(步骤S1404否),则歧义部分删除单元107删除歧义部分,从而将多个候选集成为一个候选(步骤S1406),从而结束歧义部分排除处理。
这种方式下,在根据第二实施例的交流支持设备1200中,当存在歧义部分并存在歧义部分的上位概念时,可以将歧义部分替换为上位概念,而不是简单地删除歧义部分。因此,删除歧义部分可以减少未充分传达用户意图的可能性。
接下来,描述根据第二实施例的交流支持设备1200中的交流支持处理的具体例子。
图16是显示源语言语音识别单元101输出的源语言句子的例子的说明视图。如图16所示,考虑输入源语言句子S4作为源语言句子的例子。
图17是显示由源语言分析单元102输出的候选源语言解释的例子的说明视图。如图17所示,源语言分析单元102输出候选源语言解释T4,其对应于图16中的源语言句子S4。
在图17所示的例子中,仅仅存在一个候选源语言解释,也就是说,不存在歧义部分。
图18A到18B显示了由翻译单元103输出的候选目标语言解释的例子。如图18A和18B所示,翻译单元103输出候选目标语言解释U4a和U4b,它们对应于图17的候选源语言解释T4。
在该例子中,根据一个候选源语言解释T4输出了多个候选目标语言解释U4a和U4b。这是因为对于T4中由节点标识号627标识的节点,得到了多个节点“BARRIER@727”和“GATE@730”作为候选翻译。
图19显示了由目标语言生成单元104输出的候选目标语言句子的例子。如图19所示,目标语言生成单元104输出候选目标语言句子V4a和V4b,分别对应于候选目标语言解释U4a和U4b。此外,最终输出的排除了歧义部分的目标语言句子是Z4。
图20显示了由歧义部分检测单元106检测到的歧义部分。在图20所示的例子中,显示了在歧义部分检测单元106中通过检测图18的两个候选目标语言解释U4a和U4b之间的差别部分所获得的结果W4,作为对应于所述候选的歧义部分。
图21显示了通过在概念替换单元1209中将歧义部分替换为上位概念所获得的结果的例子。在图21所示的例子中,显示了在概念替换单元1209中将歧义部分替换为对应于图20中的歧义部分检测结果W4的上位概念“ACCESS@1203”所获得的结果Y4。
图22显示了第二实施例中的交流支持处理所处理的数据的流程的例子。在图22中,显示了交流支持处理中的源句子输入如何获得候选源语言解释和候选目标语言解释,以及最终被输出为目标语言句子。此外,各条数据之间的对应关系由箭头显示。
例如,当输入源语言句子S4时,源语言分析单元102输出候选源语言解释T4。在这个例子中,因为候选源语言解释中不存在歧义,所以T4对应于排除了歧义部分的候选源语言解释。
此外,翻译单元103对排除了歧义部分的候选源语言解释T4执行翻译处理,并输出候选目标语言解释U4a和U4b。对于这些候选,由歧义部分检测单元106执行歧义部分的检测,由概念替换单元1209执行上位概念的替换,并输出排除了歧义部分的候选目标语言解释Y4。最后,目标语言生成单元104对排除了歧义部分的候选目标语言解释Y4执行目标语言生成处理,并输出排除了歧义部分的目标语言句子Z4。
图23显示了由译出部分呈现单元108所显示的译出部分显示屏幕的例子。如图23所示,该例子显示了通过语音识别,日语句子2201作为源语言句子输出,并且执行歧义部分排除处理和翻译处理,从而输出目标语言句子“Let’s meet at the access”。在这个例子中,尽管日语单词2203被检测为歧义部分,但是因为存在上位概念,所以不删除歧义部分,而是在屏幕上显示与源语言句子相同的日语句子2202作为译出部分。
这种方式下,在第二实施例中,因为可以将歧义部分替换为上位概念而不删除歧义部分,所以能够向对话的另一方传达不包含歧义部分并与用户意图匹配的翻译结果。
如上所述,对于根据第二实施例的交流支持设备,当在语音识别处理、源语言分析处理、翻译处理或者目标语言生成处理中获得多个候选处理结果时,将各个候选之间的差别部分检测为歧义部分,并且如果存在检测到的歧义部分的上位概念,则将歧义部分替换为所述上位概念。此外,如果不存在上位概念,则与第一实施例一样删除歧义部分。这使得能够排除最终输出的目标语言句子的歧义部分,从而能够获得不包含错误的正确的目标语言句子。
尽管在第一和第二实施例中,使用利用了源语言分析、语言翻译和目标语言生成的交流设备描述了本发明,但是,也可以应用如下方案的技术,即,将语义上相互等价的多对源语言和目标语言存储在存储器(平行翻译对存储器)中,作为平行翻译对,当通过从平行翻译对中选择候选目标语言句子时,实现交流支持。
在根据第一或第二实施例的交流支持设备中执行的交流支持程序可以通过存入ROM(只读存储器)等来预先提供。
可以使用一种配置,其中,通过将在根据第一或第二实施例的交流支持设备中执行的交流支持程序作为可安装格式或执行格式的文件记录在计算机可读的记录介质上来提供所述程序,所述记录介质可以是例如CD-ROM(光盘只读存储器)、软盘(FD)、CD-R(可写光盘)以及DVD(数字多用途盘)。
此外,可以使用一种配置,其中,通过将在根据第一或第二实施例的交流支持设备中执行的交流支持程序存储在连接到网络(例如因特网)上的计算机中,并通过网络下载来提供这些程序。此外,可以使用一种配置,其中,通过网络(例如因特网)来提供或分发在根据第一或第二实施例的交流支持设备中执行的交流支持程序。
在根据第一或第二实施例的交流支持设备中执行的交流支持程序具有包括多个单元(源语言语音识别单元、源语言分析单元、翻译单元、目标语言生成单元、目标语言语音合成单元、歧义部分检测单元、歧义部分删除单元、译出部分呈现单元以及概念替换单元)的模块配置,并且CPU(中央处理单元)从ROM读取交流支持程序以便执行,从而将所述单元加载到主存储器中并在主存储器上生成,作为实际的硬件。
本领域的技术人员将容易地知道其它的优点和变形。所以,本发明并不局限于这里显示并描述的具体细节和代表性的实施例。因此,在不脱离由附加的权利要求及其等价内容所定义的一般发明概念的精神和范围的情况下,可以进行各种修改。
权利要求
1.一种交流支持设备,包括分析单元,用于分析将被翻译成目标语言的源语言句子,并输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;检测单元,用于当存在多个所述候选源语言解释时,检测歧义部分,该歧义部分是所述多个候选源语言解释中的各个候选之间的差别部分;翻译单元,用于将除了所述歧义部分之外的所述候选源语言解释翻译成所述目标语言。
2.如权利要求1所述的交流支持设备,还包括概念层次存储单元,用于存储单词的语义内容的层次关系;替换单元,用于从所述概念层次存储单元中检索上位概念,所述上位概念是由所述各个候选的所述歧义部分表示的语义内容所共有的上级层次的语义内容,并且当检索到所述上位概念时,将所述歧义部分替换为所述检索到的上位概念;以及删除单元,用于当所述替换单元未用上位概念替换所述歧义部分时,删除所述歧义部分。
3.如权利要求1所述的交流支持设备,还包括生成单元,用于基于候选目标语言解释生成目标语言句子,并输出至少一个候选目标语言句子,其中,所述候选目标语言解释是用所述目标语言描述的语义内容的解释的候选,所述目标语言句子是用所述目标语言描述的句子,所述候选目标语言句子是所述目标语言句子的候选,其中,所述分析单元输出解释对应信息,所述解释对应信息是所述源语言句子和所述候选源语言解释之间的对应信息,所述翻译单元输出翻译对应信息,所述翻译对应信息是所述候选源语言解释和所述候选目标语言解释之间的对应信息,所述生成单元输出生成对应信息,所述生成对应信息是所述候选目标语言解释和所述候选目标语言句子之间的对应信息,以及呈现单元,用于基于另外提供的所述解释对应信息、所述翻译对应信息和所述生成对应信息,用所述源语言呈现所述源语言句子中的对应于所述目标语言句子的部分的字符串。
4.如权利要求3所述的交流支持设备,还包括语音识别单元,向该语音识别单元输入所述源语言的语音,所述语音识别单元识别所述输入的语音并输出至少一个候选源语言句子,所述候选源语言句子是用所述源语言描述的句子,其中,当存在多个所述候选源语言句子、多个所述候选源语言解释、多个所述候选目标语言解释、或多个所述候选目标语言句子时,所述检测单元检测歧义部分,所述歧义部分是所述多个候选源语言句子中的各个候选之间、所述多个候选源语言解释中的各个候选之间、或所述多个候选目标语言解释中的各个候选之间、或所述多个候选目标语言句子中的各个候选之间的差别部分。
5.一种交流支持设备,包括分析单元,用于分析将被翻译成目标语言的源语言句子,并输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;翻译单元,用于将所述候选源语言解释翻译成目标语言,并输出至少一个候选目标语言解释,所述候选目标语言解释是用所述目标语言描述的所述解释的候选;检测单元,用于当存在多个所述候选目标语言解释时,检测歧义部分,该歧义部分是所述多个候选目标语言解释中的各个候选之间的差别部分;以及生成单元,基于除所述歧义部分之外的所述候选目标语言解释,生成目标语言句子,并输出至少一个候选目标语言句子,其中,所述目标语言句子是用所述目标语言描述的句子,所述候选目标语言句子是所述目标语言句子的候选。
6.如权利要求5所述的交流支持设备,还包括概念层次存储单元,用于存储单词的语义内容的层次关系;替换单元,用于从所述概念层次存储单元中检索上位概念,所述上位概念是由所述各个候选的所述歧义部分表示的语义内容所共有的上级层次的语义内容,并且当检索到所述上位概念时,将所述歧义部分替换为所述检索到的上位概念;以及删除单元,用于当所述替换单元未用上位概念替换所述歧义部分时,删除所述歧义部分。
7.如权利要求5所述的交流支持设备,其中其中,所述分析单元输出解释对应信息,所述解释对应信息是所述源语言句子和所述候选源语言解释之间的对应信息,所述翻译单元输出翻译对应信息,所述翻译对应信息是所述候选源语言解释和所述候选目标语言解释之间的对应信息,所述生成单元输出生成对应信息,所述生成对应信息是所述候选目标语言解释和所述候选目标语言句子之间的对应信息,以及呈现单元,用于基于另外提供的所述解释对应信息、所述翻译对应信息和所述生成对应信息,用所述源语言呈现所述源语言句子中的对应于所述目标语言句子的部分的字符串。
8.如权利要求5所述的交流支持设备,还包括语音识别单元,向该语音识别单元输入所述源语言的语音,所述语音识别单元识别所述输入的语音并输出至少一个候选源语言句子,所述候选源语言句子是用所述源语言描述的句子,其中,当存在多个所述候选源语言句子、多个所述候选源语言解释、多个所述候选目标语言解释、或多个所述候选目标语言句子时,所述检测单元检测歧义部分,所述歧义部分是所述多个候选源语言句子中的各个候选之间、所述多个候选源语言解释中的各个候选之间、或所述多个候选目标语言解释中的各个候选之间、或所述多个候选目标语言句子中的各个候选之间的差别部分。
9.一种交流支持设备,包括分析单元,用于分析将被翻译成目标语言的源语言句子,并输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;翻译单元,用于将所述候选源语言解释翻译成目标语言,并输出至少一个候选目标语言解释,所述候选目标语言解释是用所述目标语言描述的所述解释的候选;生成单元,用于基于所述候选目标语言解释,生成目标语言句子,并输出至少一个候选目标语言句子,其中,所述目标语言句子是用所述目标语言描述的句子,所述候选目标语言句子是所述目标语言句子的候选;检测单元,用于当存在多个所述候选目标语言句子时,检测歧义部分,该歧义部分是所述多个候选目标语言句子中的各个候选之间的差别部分;以及删除单元,用于删除所述歧义部分。
10.如权利要求9所述的交流支持设备,还包括概念层次存储单元,用于存储单词的语义内容的层次关系;以及替换单元,用于从所述概念层次存储单元中检索上位概念,所述上位概念是由所述各个候选的所述歧义部分表示的语义内容所共有的上级层次的语义内容,并且当检索到所述上位概念时,将所述歧义部分替换为所述检索到的上位概念,其中,当所述替换单元未用上位概念替换所述歧义部分时,所述删除单元删除所述歧义部分。
11.如权利要求9所述的交流支持设备,其中所述分析单元输出解释对应信息,所述解释对应信息是所述源语言句子和所述候选源语言解释之间的对应信息,所述翻译单元输出翻译对应信息,所述翻译对应信息是所述候选源语言解释和所述候选目标语言解释之间的对应信息,所述生成单元输出生成对应信息,所述生成对应信息是所述候选目标语言解释和所述候选目标语言句子之间的对应信息,以及呈现单元,用于基于另外提供的所述解释对应信息、所述翻译对应信息和所述生成对应信息,用所述源语言呈现所述源语言句子中的对应于所述目标语言句子的部分的字符串。
12.如权利要求9所述的交流支持设备,还包括语音识别单元,向该语音识别单元输入所述源语言的语音,所述语音识别单元识别所述输入的语音并输出至少一个候选源语言句子,所述候选源语言句子是用所述源语言描述的句子,其中,当存在多个所述候选源语言句子、多个所述候选源语言解释、多个所述候选目标语言解释、或多个所述候选目标语言句子时,所述检测单元检测歧义部分,所述歧义部分是所述多个候选源语言句子中的各个候选之间、所述多个候选源语言解释中的各个候选之间、或所述多个候选目标语言解释中的各个候选之间、或所述多个候选目标语言句子中的各个候选之间的差别部分。
13.一种交流支持设备,包括分析单元,用于分析将被翻译成目标语言的源语言句子,并输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;检测单元,用于当存在多个所述候选源语言解释时,检测歧义部分,该歧义部分是所述多个候选源语言解释中的各个候选之间的差别部分;平行翻译对存储单元,用于存储由语义上相互等价的候选源语言解释和候选目标语言句子组成的平行翻译对;以及选择单元,用于基于除所述歧义部分外的所述候选源语言解释和存储在所述平行翻译对存储单元中的所述平行翻译对,选择所述候选目标语言句子。
14.如权利要求13所述的交流支持设备,还包括概念层次存储单元,用于存储单词的语义内容的层次关系;替换单元,用于从所述概念层次存储单元中检索上位概念,所述上位概念是由所述各个候选的所述歧义部分表示的语义内容所共有的上级层次的语义内容,并且当检索到所述上位概念时,将所述歧义部分替换为所述检索到的上位概念;以及删除单元,用于当所述替换单元未用上位概念替换所述歧义部分时,删除所述歧义部分。
15.如权利要求13所述的交流支持设备,其中所述分析单元输出解释对应信息,所述解释对应信息是所述源语言句子和所述候选源语言解释之间的对应信息,所述翻译单元输出翻译对应信息,所述翻译对应信息是所述候选源语言解释和所述候选目标语言解释之间的对应信息,所述生成单元输出生成对应信息,所述生成对应信息是所述候选目标语言解释和所述候选目标语言句子之间的对应信息,以及呈现单元,用于基于另外提供的所述解释对应信息、所述翻译对应信息和所述生成对应信息,用所述源语言呈现所述源语言句子中的对应于所述目标语言句子的部分的字符串。
16.如权利要求13所述的交流支持设备,还包括语音识别单元,向该语音识别单元输入所述源语言的语音,所述语音识别单元识别所述输入的语音并输出至少一个候选源语言句子,所述候选源语言句子是用所述源语言描述的句子,其中,当存在多个所述候选源语言句子、多个所述候选源语言解释、多个所述候选目标语言解释、或多个所述候选目标语言句子时,所述检测单元检测歧义部分,所述歧义部分是所述多个候选源语言句子中的各个候选之间、所述多个候选源语言解释中的各个候选之间、或所述多个候选目标语言解释中的各个候选之间、或所述多个候选目标语言句子中的各个候选之间的差别部分。
17.一种交流支持方法,包括分析将被翻译成目标语言的源语言句子;输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;当存在多个所述候选源语言解释时,检测歧义部分,该歧义部分是所述多个候选源语言解释中的各个候选之间的差别部分;将除了所述歧义部分之外的所述候选源语言解释翻译成所述目标语言。
18.一种交流支持方法,包括分析将被翻译成目标语言的源语言句子;输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;将所述候选源语言解释翻译成目标语言;输出至少一个候选目标语言解释,所述候选目标语言解释是用所述目标语言描述的所述解释的候选;当存在多个所述候选目标语言解释时,检测歧义部分,该歧义部分是所述多个候选目标语言解释中的各个候选之间的差别部分;基于除所述歧义部分之外的所述候选目标语言解释,生成目标语言句子,所述目标语言句子是用所述目标语言描述的句子;以及输出至少一个候选目标语言句子,所述候选目标语言句子是所述目标语言句子的候选。
19.一种交流支持方法,包括分析将被翻译成目标语言的源语言句子;输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;将所述候选源语言解释翻译成目标语言;输出至少一个候选目标语言解释,所述候选目标语言解释是用所述目标语言描述的所述解释的候选;基于所述候选目标语言解释,生成目标语言句子,所述目标语言句子是用所述目标语言描述的句子;输出至少一个候选目标语言句子,所述候选目标语言句子是所述目标语言句子的候选;当存在多个所述候选目标语言句子时,检测歧义部分,该歧义部分是所述多个候选目标语言句子中的各个候选之间的差别部分;以及删除所述歧义部分。
全文摘要
一种交流支持设备,包括分析单元,用于分析将被翻译成目标语言的源语言句子,并输出至少一个候选源语言解释,所述候选源语言解释是所述源语言句子的解释的候选;检测单元,用于当存在多个所述候选源语言解释时,检测歧义部分,该歧义部分是所述多个候选源语言解释中的各个候选之间的差别部分;翻译单元,用于将除了所述歧义部分之外的所述候选源语言解释翻译成所述目标语言。
文档编号G06F17/28GK1841367SQ200610071660
公开日2006年10月4日 申请日期2006年3月30日 优先权日2005年3月30日
发明者知野哲朗, 黑田由加, 釜谷聪史 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1