通过执行语言间的翻译来支持交流的交流支持装置和方法

文档序号:6559703阅读:163来源:国知局
专利名称:通过执行语言间的翻译来支持交流的交流支持装置和方法
技术领域
本发明涉及一种通过执行多种语言之间的翻译来支持交流的交流支持装置和交流支持方法。
背景技术
进来,由于日益增长的全球化和计算机网络技术等的发展,不同语言间交流的机会越来越多。另一方面,随着自然语言处理技术的发展,开发出了用于将用日文书写的文本翻译成用另一种语言(例如英语)书写的文本的机器翻译设备,并且已经投入使用。
随着语音处理技术的进一步发展,用于将以电子数据形式存在的自然语言字符串转换为语音而输出的语音合成设备,以及通过将用户的语音进行字符串转换从而使得可以通过语音输入自然语言字符串的语音输入设备,都已投入使用。
随着自然语言处理技术和语音处理技术中的这些发展,迫切期望将这些技术结合到一起,从而实现用于支持使用不同母语的人们之间的交流的交流支持装置。
为了实现可靠的机器翻译,需要可以涵盖广泛语言现象的语法规则、大量单词的词典、翻译知识等等。更特别地,为了实现允许自由讲话的翻译设备,除了要解决例如即使在受到一定限制的语音中也会出现的多意词、歧义等问题之外,还必须要解决会影响到翻译结果的多种语言现象,代表性的例子有不符合语法的例子,例如倒装和缩写。如上面所述,实现能够可靠地处理多种用户语音并且具有高度准确的翻译性能的翻译设备是一个难实现的目标。
为了实现高度准确的翻译,在已公开的国际申请No.WO00/13102 A1中提出了一种技术,其中,将用于简化根据输入句子的翻译的复述过的句子提供给用户,并且对用户所选择的句子执行翻译处理。
通常,如果翻译处理本身是失败的,或者通过翻译处理仅得到了部分译文,从而并未将用户的语音内容正确地发送到目标语言扬声器,那么用户就指示翻译机器重新输入或重新处理,以便再次尝试翻译处理。
但是,因为翻译机器通过对相同的语音执行重新输入或重新处理通常会输出相同的翻译结果,所以会出现总是无法正确地发送该语音内容的问题。此外,为了避免该问题并且输出不同的翻译结果,用户就必须用源语言中的另一种表达方式来表达将被发送的内容,并且如果可能的话,用户必须在推测出可以由翻译机器翻译的一个句子后重新输入另一种表达。
在已公开的国际申请No.WO 00/13102 A1中的方法中,在进行翻译处理之前提供一个复述(paraphrase)句子。但是,用户并不考虑什么类型的句子是可以由翻译机器翻译的,或者为何最近的语音内容不能被正确翻译。因此,用户总是不能采用或说出可以被翻译机器正确地翻译的输入句子。

发明内容
根据本发明的一个方面,一种交流支持装置包含输入接受单元,用于接受由用户输入的待翻译的源语言句子;复述知识存储单元,用于存储复述知识,其中,作为源语言句子的语义内容的解释的源语言解释与复述解释相关联,该复述解释与所述源语言解释具有相同的语义内容和不同的表达形式;源语言分析单元,用于分析输入的源语言句子的语义内容并且输出源语言解释;复述单元,用于从复述知识存储单元获得与输出的源语言解释相关联的复述解释,并且根据获得的复述解释将输入的源语言句子复述为源语言复述句子;以及翻译单元,用于将输出的源语言解释翻译成第一目标语言句子并且将获得的复述解释翻译成第二目标语言句子。
根据本发明的另一个方面,一种交流支持方法包含接受用户输入的待翻译的源语言句子;分析输入的源语言句子的语义内容;输出源语言解释;从复述知识存储单元获得与输出的源语言解释相关联的复述解释,根据获得的复述解释将输入的源语言句子复述为源语言复述句子,其中,所述复述知识存储单元存储源语言解释以及复述解释,该复述解释与源语言解释具有相同的语义内容和不同的表达形式;将输出的源语言解释翻译成第一目标语言句子并且将获得的复述解释翻译成第二目标语言句子。


图1是显示根据第一实施例的交流支持装置的结构的框图;图2是显示在根据第一实施例的交流支持装置中处理的数据的例子的示意图;图3是显示复述知识存储单元的数据结构的例子的示意图;图4是第一实施例中的交流支持处理的流程图;图5是显示用于提供翻译结果的屏幕的内容的例子的示意图;图6是显示用于提供复述结果的屏幕的内容的例子的示意图;图7是第一实施例中的复述处理的流程图;图8是显示了在根据第一实施例的交流支持装置中处理的数据的例子的示意图;图9是显示根据第二实施例的交流支持装置的结构的框图;图10是显示输入记录存储单元的数据结构的例子的示意图;图11是显示由复述知识提取单元提取的复述知识的例子的示意图;图12A、12B和12C显示了第二实施例中交流支持处理的流程图;图13是复述知识提取处理的流程图;图14是显示复述知识存储单元的数据结构的例子的示意图;图15是显示交流支持处理中输出的数据的例子的示意图;图16是显示交流支持处理中输出的数据的例子的示意图;图17是显示输入/重新输入集合[I]的数据结构的例子的示意图;图18是显示通过复述知识提取处理获得的复述知识的例子的示意图;
图19是显示根据第三实施例的交流支持装置的结构的框图;图20A和20B显示了第三实施例中的交流支持处理的流程图;图21是第三实施例中的复述知识更新处理的流程图;图22是显示复述知识集合[P]的例子的示意图;图23是显示复述知识存储单元的例子的示意图;图24是显示复述知识存储单元中存储的数据的例子的示意图;图25是显示通过交流支持处理输出的数据的例子的示意图;图26是显示复述知识集合[P]的例子的示意图;图27是显示复述知识存储单元的例子的示意图;以及图28是显示由交流支持处理输出的数据的例子的示意图。
具体实施例方式
接下来将参考附图,详细描述根据本发明的交流支持装置和交流支持方法的典型实施例。
配置根据第一实施例的交流装置以通过参考预先存储在存储单元中的复述知识,将输入源语言句子转换为源语言复述句子,其中该源语言复述句子与输入源语言句子具有相同或等价的语义内容和不同的表达形式,从而向用户提供源语言复述句子。尽管描述是针对将作为源语言的日语翻译为作为目标语言的英语的处理的,但是源语言和目标语言的组合并不局限于此,该装置可以应用于各种语言的组合。
图1是显示根据本发明的第一实施例的交流支持装置100的结构的框图。交流支持装置100包含输入接受单元101、源语言分析单元102、翻译单元103、显示控制单元104、复述单元105、输出单元106以及复述知识存储单元121。
输入接受单元101用于从用户接受源语言句子输入。可以通过所有通常使用的输入方法,例如键盘、定点设备、手写识别等等来输入源语言。此外,输入接受单元101还可以用于从用户接受语音输入,并且对接受的语音进行语音识别处理,从而输出源语言句子。
可以通过应用任何通常使用的语音识别方法来执行语音识别处理,例如使用线性预测系数(Linear Predictive Coefficient)分析、隐马尔可夫模型(Hidden Markov Model,HMM)、动态规划(Dynamicprogramming)、神经网络(Neural network)、N-元语法语言模型(N-gram language model)等等。
源语言分析单元102用于通过参考源语言的词汇信息和语法规则,对由输入接受单元101接受的源语言句子进行自然语言分析处理从而输出源语言解释,所述源语言解释是源语言句子所表示的语义内容的解释,所述自然语言分析处理是例如形态(morphological)分析、语法(syntactic)分析、依存(dependency)分析、语义(semantic)分析、话语(discourse)分析等等。
由源语言分析单元102执行的自然语言分析处理可以采用任何常用的方法,例如使用A*算法的形态分析和使用Earley分析、Chart分析、或通用LR分析(generalized LR parsing)等等的语法分析。此外,可以将用于自然语言处理的词典存储在通常使用的存储单元中,例如HDD(硬盘驱动器)、光盘、存储卡、RAM(随机访问存储器),并且在进行自然语言分析处理时参考该词典,所述词典存储有形态信息、语法信息、语义信息等等。
在第一实施例中,将源语言句子的语素序列和语法结构作为源语言解释输出。语素序列是源语言句子的形态分析的结果,并且是由包含构成源语言句子的单词和其中的部分语音的组合构成的序列。此外,语法结构是对源语言句子进行语法分析的结果,在分析中,使用语法规则(例如上下文无关的语法等等)对源语言结构进行分析。
接下来将显示由源语言分析单元102输出的源语言解释的形式的例子。图2是显示由根据第一实施例的交流支持装置处理的数据的例子的示意图。当输入了该图中所示的源语言句子A201之后,就可以得到图中语素序列A202所示形式的所述句子的语素序列。
语素序列A202指示可以将源语言句子A201分为如图中所示的三个单词,即单词A203、A204和A205,并且语音的这些部分分别被指定了对应的文法分类,即“pron”、“cm”和“v”。
此外,以图中的语法结构A206所示的形式给出了与源语言句子A201有关的语法结构。
语法结构A206是表示对应于输入表面(input surface)的单词和文法分类之间的替换关系的形式。也就是说,作为语法结构A206的一部分的语法结构A207指示可以用文法分类np替换文法分类pron和cm,而且,语法结构A206指示可以用文法分类s替换文法分类np和vp。
上面的描述形式是示例性的,并且任何通常使用的语素序列和语法结构的描述形式都是可用的。
翻译单元103用于将日文的源语言句子翻译为英文的目标句子。所有用于机器翻译系统的方法,例如通用转换方法、基于例子的方法、基于统计的方法、中间语言(interlingua)方法,都可以被用于在翻译单元103处进行的翻译处理。
显示控制单元104用于向用户提供源语言分析单元102在对源语言句子进行分析处理以及翻译单元103在对源语言句子进行翻译处理中出现的处理故障信息。也就是说,在检查下一个将被输入的源语言句子时,用户不仅可以参考输入源语言句子的翻译结果,而且还可以参考一系列分析和翻译处理的成功/失败情况以及问题。例如,可以将显示了句子被部分地翻译的信息作为故障信息提供给用户。
另外还提供由翻译单元103生成的目标语言句子。从而,理解目标语言的用户可以直接估计所提供的翻译结果的适当性。
而且,显示控制单元104可以用于向用户提供由复述单元105输出的源语言复述句子,并且如果用户选择所提供的源语言复述句子,就将该源语言复述句子发送到输入接受单元101作为源语言句子的输入。从而,可以降低用户重新输入源语言句子的负担。
复述知识存储单元121用于存储复述知识,其中作为要被翻译的源语言句子的语义内容的解释的源语言解释与复述解释相关联,该复述解释与源语言解释具有相同的语义内容,但是具有不同的表达形式。而且,复述知识存储单元121可以用于通过将复述知识与优先级相关联来存储复述知识,其中该优先级表示应用复述知识时的优先顺序。在本实施例中,优先级表示为从1到10的离散值,并且使得具有较大值的复述知识被优先应用于复述处理。同时,优先级的表现形式并不限于此,可以使用任何一种可以表示应用复述知识的优先顺序的标准。复述知识存储单元121可以包括任何常用的存储单元,例如HDD、光盘、存储卡、RAM等等。
图3是显示复述知识存储单元121的数据结构的例子的示意图。如图中所示,复述知识存储单元121存储有相互关联的复述知识和优先级。既可以用语法结构,也可以用语素序列来表示源语言解释和指示复述知识的复述解释。
在如图所示的例子中,通过待转换的源语言句子的语法结构和转换后的语法结构的组合来表示复述知识201。而且,通过待转换的源语言句子的语素序列和转换后的语素序列来表示复述知识202。
这里,将表示待转换的语法结构或语素序列的部分称作前项部分。当输入了源语言句子后,就对符合相对于源语言句子的源语言解释的前项部分进行搜索,并且获得与搜索到的前项部分相关的复述解释,然后将其用于复述处理。在图中所示的例子中,指示出了由语法结构表示的前项部分203和由语素序列表示的前项部分204。前项部分203和204对应于源语言解释,而转换后的语法结构210对应于复述解释。
在复述知识中,可以由包含在双括号中的变量部分205和207以及非变量部分206表示语法结构和语素序列,其中可以进行动态分配,而非变量部分是其它的通用语言表达形式并且无法编辑。可以仅由变量部分或仅由非变量部分来表示复述知识中的语法结构和语素序列。
可以使用符号‘?’,按照“《文法分类?》”的形式来表示变量部分。这意味着属于一个所描述的文法分类的任何单词都可以被分配。如图中变量部分207所示,还可以使用符号‘*’,按照“《*》”的形式来表示变量部分。这意味着可以将任意语法结构或语素序列分配给变量部分。
复述单元105用于通过将语素序列和语法结构作为检索关键词,从复述知识存储单元121获得可应用的复述知识,并且将获得的复述知识应用于源语言句子,从而生成源语言复述句子,其中,所述语素序列和语法结构是源语言分析单元102对源语言句子进行分析而得到的分析结果。
这里,“复述知识是可应用的”的含义是可以将作为每个复述知识的前项部分的待转换的语法结构或语素序列分配给与输入的源语言句子相关的语法结构或语素序列。如果存在多个可应用的复述知识,那么就使用具有最高适用性的那个复述知识。可以进行配置以按照适用性的降序来使用预定数量的复述知识,并且输出多个源语言复述句子。
按照以下方式来计算适用性,即,如果复述知识的前项部分覆盖关于输入源语言句子的语法结构和语素序列的比例越大,其非变量部分的数量越小,则复述知识的优先级越大,适用性就越高。而且,在计算适用性时,与语素序列相比,语法结构的复述知识的前项部分较大。可以将用于计算使得结构和表面一致性最大的前项部分的分配的动态规划应用于该估计。
如果复述知识的优先级并未存储在复述知识存储单元121中,那么复述单元105就使用除优先级之外的元素来计算适用性。而且,复述单元105可以用于使得翻译单元103对生成的源语言复述句子进行翻译处理,并且在确认翻译会成功并且会防止在初始输入中出现的错误时输出源语言复述句子。
输出单元106用于接收经过翻译单元103翻译的目标语言句子,并且将其内容以目标语言英语的合成语音输出。所有通常使用的方法,例如音素编辑语音合成、共振峰语音合成、基于主体的(corpus-based)语音合成、文本到语音等等,都可应用于由输出单元106执行的语音合成处理。
输出单元106可以不进行语音输出。也就是说,可以由输入设备(例如键盘、定点设备等等)进行源语音的文本输入,并且由显示设备(例如显示有文本的显示器)进行目标语音的文本输出,而代替通过输入接受单元101的语音输入以及通过输出单元106的语音输出。还可以通过文本打印将目标语言句子输出到打印机等等。而且,还可以在需要的情况下转换或组合上述输出方法。
接下来,将说明根据如此配置的第一实施例的交流支持装置100所执行的交流支持处理。图4是显示第一实施例中的交流支持处理的整个流程的流程图。
首先,输入接受单元101接受由用户输入的源语言句子(此后称作Si)的输入(步骤S301)。接下来,源语言分析单元102对源语言句子Si进行自然语言分析处理,从而输出源语言解释(步骤S302)。具体地,源语言分析单元102输出作为形态分析的结果的语素序列(此后称作Sm)和作为语法分析的结果的语法结构(此后称作Sa)。
接下来,翻译单元103输出用翻译目标语言表示的目标语言句子(此后称作To),其中通过翻译由源语言分析单元102输出的源语言解释而得到目标语言句子(步骤S303)。
而且,显示控制单元104在翻译结果显示器上显示源语言句子Si、目标语言句子To,以及翻译结果(此后称作Tr)(步骤S304)。图5是显示翻译结果显示的内容的例子的示意性视图。该翻译结果是在分析处理和翻译处理中出现的处理故障信息。
在该图中,输入句子显示区域401是用于显示源语言句子的部分,并且这是输入接受单元101接受最新的用户语音的输入的结果。翻译显示区域402是用于显示目标语言句子的部分,并且这是对源语言句子进行翻译的结果。翻译状态显示区域403是用于显示翻译结果Tr的部分。
在该图中显示了一个例子,其中源语言句子S401被显示为输入源语言句子并且被翻译,从而输出目标语言句子S402(“Hurry,Isaid.”),另外还显示了翻译结果S403,而该翻译结果指示该翻译是失败的并且仅获得了部分翻译。
用户通过参考翻译结果显示器上显示的信息从而判断是否根据语音意图正常地进行了翻译,并且输入翻译成功或失败。
接下来,输入接受单元101判断是否从用户接收到了指示翻译成功的输入(步骤S305)。如果输入接受单元101没有接收到翻译成功(步骤S305否),那么它就执行复述处理以便获得源语言复述句子(此后称作Sp),而该句子是源语言句子Si的复述(步骤306)。在下文中会详细描述复述处理。
在执行了复述处理后,显示控制单元104在复述结果显示器上显示通过复述处理获得的源语言复述句子Sp(步骤S307)。图6是显示复述结果显示器的内容的例子的示意图。在该图中,变形例子显示区域501是用于显示源语言复述句子的部分,它是对源语言句子进行复述处理后得到的复述的结果。区域501可以通过下划线等等来强调地显示源语言句子和源语言复述句子之间的差别502。
可以配置变形例子显示区域501,从而使得当用户确定显示在变形例子显示区域501上的源语言复述句子与语音意图相符时,用户能够直接选择源语言复述句子作为将被输入单元再次输入的源语言,例如通过麦克风、键盘、定点设备等等输入的语音。
通过上述处理,即使在翻译失败的情况下,也可以向用户显示源语言复述句子,并且可以强调地显示复述后的部分,所述源语言复述句子是可以被正确地翻译的句子的例子。因此,用户可以确定翻译失败的原因,并且正确地改进表达方式。而且,因为可以将所显示的变形后的例句作为源语言句子输入,所以可以降低用户重新输入源语言句子的负担。
在显示控制单元104进行显示之后,输入接受单元101接受源语言句子Si的重新输入(步骤S308),并且操作返回到由源语言分析单元102进行的对源语言句子的分析处理,并且该处理被重复(步骤S302)。
如果在步骤S305确定接收到了指示翻译成功的输入(步骤S305是),那么输出单元106就对目标语言句子To进行语音合成,并且用目标语言的语音输出目标语言句子(步骤S309),然后该交流支持处理结束。
根据第一实施例的交流支持装置100可以例如当用户确定首次显示的翻译结果是成功的并且没有问题时,在不执行复述处理的情况下,输出作为翻译的结果的目标语言句子To的语音。因此,与第一文档中的方法不同,无论翻译处理是成功的还是失败的,都不需要选择复述过的句子,从而降低了用户的操作负担。
接下来,将详细描述步骤S306的复述处理。图7是显示第一实施例中的复述处理的整个流程的流程图。
首先,复述单元105通过将作为源语言句子的分析结果的语素序列Sm和语法结构Sa作为检索关键词,从复述知识存储单元121获得可应用的复述知识,并且将获得的复述知识存储到复述知识集合[P](步骤S601)。复述知识集合[P]是用于将复述知识存储到例如RAM的存储单元的信息。在开始复述处理时,复述知识集合[P]应该是空的。
接下来,复述单元确定复述知识集合[P]是否是空的(步骤S602)。如果集合[P]是空的(步骤S602是),那么就不存在可以应用的复述知识,并且不能输出源语言复述句子,从而结束复述处理。
如果集合[P]不是空的(步骤S602否),那么复述单元105就从[P]获得具有最高适用性的可用的复述知识(此后称作Px)(步骤S603)。这里,“可用的复述知识”的意思是指一种复述知识,其中已经删除了通过如下面所述的翻译结果的确定处理所确定的不会被正确地翻译的复述知识。因此,包含在集合[P]中的所有复述知识在第一次处理中都是可用的。
接下来,复述单元105通过应用获得的复述知识Px对源语言句子进行复述,从而生成源语言句子Sp(步骤S604)。例如,当输入图8中的源语言句子A801,并且获得的复述知识Px是图3中的复述知识201时,生成图8中的源语言复述句子A802作为源语言复述句子Sp。
接下来,翻译单元103翻译源语言复述句子Sp,并且输出目标语言句子(此后称作Tor)(步骤S605)。而且,翻译单元103确定是否正常地执行了翻译处理(步骤S606)。如果正常地执行了该处理(步骤S606是),那么复述单元105就输出源语言复述句子Sp,从而结束复述处理(步骤S608)。
如果没有正常地执行该翻译处理(步骤S606否),那么复述单元105就使得所获得的复述知识Px不能再被使用(步骤S607)。接下来,复述单元105确定是否处理完了复述知识集合[P]内的所有复述知识(步骤S609)。如果未处理完所有复述知识(步骤S609否),那么复述单元105就通过获得具有最高适用性的复述知识未重复该处理(步骤S603)。如果处理完了所有复述知识(步骤S609是),那么就结束复述处理。
通过这种方式,根据第一实施例的交流支持装置100可以向用户提供能够翻译的源语言复述句子,直到正常地完成了翻译,其中源语言复述句子与输入的源语言句子具有相同或等价的语义内容,但是具有不同的表达形式。因此,用户可以知道翻译失败的原因,并且通过参考提供的源语言复述句子从而正确地改进输入句子。而且,因为可以将提供的源语言复述句子指定为将重新输入的源语言句子,所以可以降低重新输入的负担。
根据第二实施例的交流支持装置用于从初始输入,或者每个重新输入的句子,以及最终被用户采用的重新输入的句子提取复述知识,从而将提取的复述知识作为新的复述知识登记在存储单元中,其中所述初始输入被确定为未被完全地翻译并且未被用户采用。
图9是显示根据第二实施例的交流支持装置700的结构的框图。如图所示,交流支持装置700包含输入接受单元、源语言分析单元102、翻译单元103、显示控制单元104、复述单元105、输出单元106、复述知识提取单元707、复述知识存储单元121以及输入记录存储单元722。
除了在第二实施例中加入了复述知识提取单元707和输入记录存储单元722以外,第二实施例与第一实施例类似。其它结构和功能与图1的框图中所示的根据第一实施例的交流支持装置100的结构和功能是相同的,因此就用相同的参考数字来表示相应的部分,并且不再进行描述。
输入记录存储单元722使得由输入接受单元101接受的源语言句子、作为源语言分析单元102对源语言句子进行分析而得到的结果的语素序列和语法结构,以及关于源语言句子的输入的重新输入标记状态相互联系到一起,并且按照语音顺序存储它们。重新输入标记具有“OFF”状态和“ON”状态,“OFF”状态指示了用户的输入是相对于特定语音意图或语音内容的第一次输入,而“ON”状态则指示了这是第二次或其之后的重新输入。从而,当提取复述知识时,能够指明由用户重新输入的范围。
图10是显示输入记录存储单元722的数据结构的例子的示意图。如图所示,输入记录存储单元722使得源语言句子803、作为源语言句子803的形态分析结果的语素序列804、作为源语言句子803的语法分析结果的语法结构805,以及重新输入标记状态806彼此相关联作为一个输入记录,并将其存储为一个语音输入的单位。在该图中,显示了一个例子,其中存储有输入记录801和802。
按照与输入时间相反的顺序安排每个输入记录,并且在上述例子中,按照这种方式存储输入记录,因而靠上的输入记录是较新的语音输入。通过参考输入记录存储单元722,例如,可以发现对应于输入记录801的语音比对应于输入记录802的语音更新,并且它们是连续的语音。
复述知识提取单元707用于提取一组初始输入,或者相对于初始输入的重新输入的句子中的每一个,以及最终被用户采用的重新输入的句子,作为复述知识,其中该初始输入被确定为未被完全地翻译并且未被用户采用,其中复述是源语言句子之间的转换。
图11是一个显示由复述知识提取单元707提取的复述知识的例子的示意图。该图显示了当图10中的输入记录802内的源语言句子被设置为初始输入句子,而输入记录801内的源语言句子被设置为重新输入的句子时,所提取的复述知识的例子。按照下述四个阶段提取复述知识,并将其存储到复述知识存储单元121中,并且不重叠。
第一,使得初始输入句子和重新输入句子都分别与作为结构分析的结果的语法结构相关联,并且被提取作为复述知识。这里,在本实施例中将初始优先级设置为5。因此,获得了如图11中所示的复述知识901。
第二,使得作为对初始输入句子和重新输入句子的每一个进行分析而得到的结果的语法结构与用参数表示其部分单词的语法结构相关联,并且被提取作为复述知识。这里,在本实施例中将初始优先级设置为3。因此,获得了如图11中所示的复述知识902。
第三,使得初始输入句子和重新输入句子中的每一个都与作为形态分析的结果的语素序列相关联,并且被提取作为复述知识。这里,在本实施例中将初始优先级设置为3。因此,获得了如图11中所示的复述知识903。
第四,使得作为对初始输入句子和重新输入句子进行形态分析而得到的结果的语素序列中的每一个都与用参数表示其部分单词的语素序列相关联,并且被提取作为复述知识。这里,在本实施例中将初始优先级设置为1。因此,获得了如图11中所示的复述知识904。
尽管在图中显示了其中仅用参数表示了一个单词的例子,但是可以提取其中用参数表示多个单词并且彼此相关的复述知识。另外,该处理可以是受限的,从而在第二和第四步骤可用参数表示的文法分类包含,例如实义词,例如名词、动词和副词。而且,分配给在每个步骤被提取的复述知识的初始优先级可以不是在每个步骤确定的值。
接下来,将描述具有上述结构的根据第二实施例的交流支持装置700所执行的交流支持处理。图12A、12B和12C显示了第二实施例中的交流支持处理的流程图。
首先,输入接受单元101接受用户输入的源语言句子Si(步骤S1001)。而且,输入接受单元101将用于识别正在被输入的语音是重新输入还是正常输入的重新输入标记设置为“OFF”,从而将该语音设置为正常输入状态。在步骤S1011将重新输入标记设置为“ON”(稍后会对该步骤进行描述),并且在判断是否执行复述知识提取处理时参考该标记(步骤S1013)。
接下来,输入接受单元101将接受的源语言句子Si存储到输入记录存储单元722(步骤S1002)。这里所接受的源语言句子Si被存储,同时与重新输入标记的“OFF”状态相关联。
然后,源语言分析单元102对源语言句子Si执行自然语言分析处理,从而输出源语言解释,并且将该源语言解释存储到输入记录存储单元722(步骤S1003)。具体地,源语言分析单元102输出作为形态分析的结果的语素序列Sm和作为语法分析的结果的语法结构Sa,并且将它们存储到输入记录存储单元722。
从步骤S1004到步骤S1009的翻译处理、复述处理、显示处理和重新输入接受处理类似于根据第一实施例的交流支持装置100的从步骤S303到步骤S308的处理,因此不再重复说明。
在步骤S1009处接受了源语言句子的重新输入之后,输入接受单元101将重新输入标记重新设置为“ON”(步骤S1010),并且操作处理返回到由源语言分析单元102进行的对源语言句子的分析处理,并且对该处理进行重复(步骤S1003)。
如果在步骤S1006确定接受了指示翻译成功的输入(步骤S1006是),输出单元106就对目标语言句子To进行语音合成,并且将其作为目标语言的语音输出(步骤S1012)。
然后,根据第二实施例的交流支持装置700执行随后的步骤S1013和1014的处理,用于从源语言句子的输入记录中提取复述知识。
首先,复述知识提取单元707确定重新输入标记是否被设置为“ON”(步骤S1013)。如果该标记未被设置为“ON”(步骤S1013否),那么就未执行源语言句子的重新输入,并且不存在要被提取的复述知识,从而结束交流支持处理。
如果该标记被设置为“ON”(步骤S1013是),那么就执行复述知识提取处理(步骤S1014),并且结束交流支持处理。接下来将详细描述复述知识提取处理。
图13是显示在步骤S1014的复述知识提取处理的整个流程的流程图。首先,复述知识提取单元707从输入记录存储单元722获得尚未获得的输入记录中最新的输入记录(步骤S1101)。接着,复述知识提取单元707从获得的输入记录中获得源语言句子、语素序列和语法结构,并且将它们加入到输入/重新输入集合[I](步骤S1102)。输入/重新输入集合[I]是用于将输入记录存储到例如RAM的存储单元中的信息。在提取与特定语音意图或语音内容有关的复述知识之前,输入/重新输入集合[I]应该是空的。
接着,复述知识提取单元707确定对应于获得的输入记录的重新输入标记是否被设置为“ON”(步骤S1103)。如果该标记被设置为“ON”(步骤S1103是),那么该单元就通过获得下一个输入从而重复该处理(步骤S1101)。从而,可以获得相关于与某个语音意图或语音内容有关的初始输入句子的全部重新输入句子。
如果重新输入标记未被设置为“ON”(步骤S1103否),那么就确定获得了与特定语音意图或语音内容有关的初始输入句子,然后按照下述方式在步骤S1104和S1105提取复述知识。
首先,复述知识提取单元707从输入/重新输入集合[I]获得一组语素序列(此后称作Im)和语法结构(此后称作Ia)(步骤S1104)。这里,因为接受到指示了翻译成功的输入的语音(也就是被用户采用的语音)被包含在在步骤S1003输出的关于初始输入句子(还是被用户采用的句子)的语素序列Sm和语法结构Sa中,所以包含相关联的语素序列Sm、语法结构Sa和语素序列Im、语法结构Ia的复述知识被存储到复述知识存储单元121(步骤S1105),然后复述知识提取处理结束。这里,不应该加入那些具有与复述知识存储单元121中已经包含的内容类似的内容的复述知识,并且应该删除用于确定没有转移操作的自转移的转移知识。
接着,将描述第二实施例中交流支持处理的一个具体例子。图14是显示复述知识存储单元121的数据结构的例子的示意图。而且,图15是显示在该例子中的交流支持处理中输出的数据的例子的示意图。这里,假设如图14中所示的复述知识已经登记在复述知识存储单元121中。
首先,输入接受单元101接受源语言句子的输入(步骤S1001)。这里,用户发出如图15所示的源语言句子1301的语音,并且该语音的语音识别结果的输入被接受。源语言分析单元102分析源语言句子1301(步骤S1003),从而输出语素序列1302和语法结构1303。
此外,翻译单元103执行翻译处理,从而输出目标语言句子1304(步骤S1004)。此时,同时输出包含有关于翻译处理是否成功的信息以及出现在分析处理中的错误的翻译结果1305。在该例子中,翻译结果1305表示翻译失败并且仅部分地执行了翻译,因此仅获得了部分译文。
从而,用户可以确认源语言句子1301,也就是他的语音,未被正确地翻译为作为目标语言的英语。如果用户确定翻译并不恰当,那么输入接受单元101在步骤S1006就确定没有接受到成功的翻译(步骤S1006否),并且执行复述处理(步骤S1007)。
复述处理通过参考复述知识存储单元121,将复述知识加入到复述知识集合[P](步骤S601),在所述复述知识中相对于源语言句子1301的语素序列Sm和语法结构Sa满足前项部分。
在该例子中,图14中复述知识1201的前项部分被满足,因而将复述知识1201应用于源语言句子1301,以便生成源语言复述句子1306(步骤S604)。如果源语言复述句子1306的翻译处理是成功的(步骤S606是),那么就输出源语言复述句子1306(步骤S608)。另外源语言复述句子1306的翻译结果1307也被输出(步骤S605)。
通过获得如图15中所示的源语言复述句子1306,用户能够确认如果在单词W1307之后加入一个单词W1308,那么翻译就会成功,因此用户可以正确地改进重新输入句子。而且,在源语言复述句子1306可以被用作输入句子的情况下,用户可以进行一种操作从而在屏幕上指定源语言复述句子1306,从而容易地重新输入源语言句子。
假设用户确定源语言复述句子1306不符合语音意图并且重新输入源语言句子(步骤S1009)。图16是显示该例子中的交流支持处理输出的数据的例子的示意图。
该图指示了一个例子,其中源语言句子1401作为重新输入句子被输入。在这种情况下,输入接受单元101将重新输入标记设置为“ON”(步骤S1010),并且在输入时将源语言重新输入句子与重新输入标记的“ON”状态彼此关联,然后将它们存储到输入记录单元(步骤S1011)。接着,源语言分析单元102对重新输入句子进行分析处理(步骤S1003),从而输出语素序列1402和语法结构1403。
接着,翻译单元103执行翻译处理,从而同时输出目标语言句子1404和翻译结果1405(步骤S1004)。如果用户确定已经正确地进行了翻译并且输入接受单元101接受到指示关于此输出的翻译成功的输入(步骤S1006是),那么输出单元106就对目标语言句子1404进行语音合成,并且输出语音合成结果(步骤S1021)。
接下来,执行复述知识提取处理。这里,假设如图10中所示的信息存储在输入记录存储单元722中,并且假定如上所述的输入的例子。
首先,按照从最新的语音到较早的语音的顺序将输入记录添加到输入/重新输入集合[I],直到获得了其重新输入标记为“OFF”状态的语音(步骤S1102)。但是在本实施例中,并不采用等同于源语言输入Si的语音,其是用户所采用的最新的输入。图17是显示如此获得的输入/重新输入集合[I]的数据结构的例子的示意图。
如图中所示,输入/重新输入集合[I]存储有一个输入记录。接下来,从输入/重新输入集合[I]中提取语素序列Im和语法结构Ia(步骤S1104),并且通过将当时所存储的语素序列Sm和语法结构Sa,也就是相对于用户所采用的源语音输入Si的步骤S1003处的输出,与提取的语素序列Im和语法结构Ia联系到一起从而提取复述知识(步骤S1105)。图18是显示通过复述知识提取处理获得的复述知识的例子的示意图。
该图中所示的例子是按照下述四个步骤提取的复述知识。第一,使得关于初始输入句子的语法结构Sa和Ia联系到一起从而获得复述知识,并且将其初始优先级设置为5。从而,就获得了图18中的复述知识1601。第二,使得语法结构Sa和Ia与其中用参数表示相应的单词的语法结构联系到一起,从而获得复述知识,并且将其初始优先级设置为3。因此,获得了复述知识1602、1603和1604。
第三,使得语素序列Sm和语法结构Im联系到一起从而获得复述知识,并且将其初始优先级设置为3。从而,就获得了图18中的复述知识1605。第四,使得语素序列Sm和Im与其中用参数表示相应的单词的语素序列联系到一起,从而获得复述知识,并且将其初始优先级设置为1。因此,获得了复述知识1606、1607和1608。
对提取的复述知识进行登记,以便不与已经存储在复述知识存储单元121中的复述知识相重叠。也就是说,不应该将已经登记了的复述知识添加到复述知识存储单元121。
通过这种方式,在根据第二实施例的交流支持装置中,通过参考已经被复述过由用户重新输入的句子,可以提取复述知识,并且可以将复述知识登记到存储单元。因此,可以逐渐地扩展可复述语音的范围,从而获得很好地适应于用户的语音习惯的复述知识。而且,还可以加强改进对用户的支持的重新输入句子,从而进一步降低源语言句子的输入处理负担。
根据第三实施例的交流支持装置用于当用户选择所提供的源语言复述句子时,提高对应于源语言复述句子的复述知识的优先级,或者降低生成未被采用的源语言复述句子的复述知识的优先级。
图19是显示根据第三实施例的交流支持装置1700的结构的框图。如图所示,交流支持装置1700包含输入接受单元101、源语言分析单元102、翻译单元103、显示控制单元104、复述单元105、输出单元106、复述知识提取单元707、复述知识更新单元1708、复述知识存储单元121以及输入记录存储单元722。
除了加入了复述知识更新单元1708以外,第三实施例与第二实施例类似。第三实施例的其它结构和功能与图9的框图所示的根据第二实施例的交流支持装置700的结构和功能是相同的,因此使用了相同的参考数字,并且不再重复对其的描述。
复述知识更新单元1708用于当用户选择所提供的源语言复述句子时,提高对应于源语言复述句子的复述知识的优先级,或者降低生成未被采用的源语言复述句子的复述知识的优先级。具体地,当用户采用了复述单元提供的源语言复述句子时,或内容与用户说出的相同时,复述知识更新单元1708提高实现了源语言复述句子的复述的复述知识的优先级,并且提高复述知识存储单元121中可以实现类似的复述处理的复述知识的优先级。而且,在用户的语音与源语言复述句子不同的情况下,复述知识更新单元1708执行处理以降低实现复述的复述知识的优先级,以及降低复述知识存储单元121中实现类似的复述处理的复述知识的优先级。
另外,可以配置复述知识更新单元1708,以使得当用户未进行复述就对初始输入正常地进行了翻译时,提高能够生成输入语音的复述知识的优先级。通过上述处理,可以动态地改变在生成源语言复述句子时采用复述知识的优先级。而且因此,很好地适应于用户的复述知识具有优先权,以便避免应用那些用户不希望使用的复述知识。
接下来将描述根据第三实施例的具有上述结构的交流支持装置1700的交流支持处理。图20A和20B显示了第三实施例中交流支持处理的流程图。
从步骤S1801到步骤S1811的输入接受处理、源语言分析处理、翻译处理、复述处理、屏幕显示处理以及重新输入接受处理类似于根据第二实施例的交流支持装置700的从步骤S1001到步骤S1011的处理,因此这里不再对它们进行说明。而且,从步骤S1816到步骤S1818的语音输出处理和复述知识提取处理类似于根据第二实施例的交流支持装置700的从步骤S1012到步骤S1014的处理,因此这里就不再对它们进行说明。
第三实施例与第二实施例的区别之处在于,在第三实施例中加入了通过参考重新输入句子从而更新复述知识的优先级的处理,即步骤S1812到S1815。接下来将详细描述该处理。
首先,在输入接受单元101在步骤S1811将重新输入标记更新为“ON”之后,复述知识更新单元1708确定重新输入源语言句子(重新输入句子)是否与通过复述处理生成的源语言复述句子相同(步骤S1812)。
如果重新输入句子与源语言复述句子相同(步骤S1812是),那么复述知识更新单元1708就将复述采用标记设置为“ON”(步骤S1813)。如果重新输入句子不同于源语言复述句子(步骤S1812否),那么复述知识更新单元1708就将复述采用标记设置为“OFF”(步骤S1814)。
之后,复述知识更新单元1708执行复述知识更新处理(步骤S1815),并且操作返回到源语言分析单元102所进行的对源语言句子的分析处理(步骤S1803)。接下来将详细描述在步骤S1815的复述知识更新处理。
图21是显示第三实施例的复述知识更新处理的整个流程的流程图。首先,复述知识更新单元1708确定复述采用标记是否被设置为“ON”(步骤S1901)。如果复述采用标记被设置为“ON”(步骤S1901是),那么复述知识更新单元1708就将更新优先级(此后称作u)设置为1(步骤S1902)。如果复述采用标记被设置为“OFF”(步骤S1901否),那么复述知识更新单元1708就将更新优先级(此后称作u)设置为-1(步骤S1903)。这里所设置的更新优先级并不限于上述这些值,而是可以根据适用性动态地进行更改。
接下来,复述知识更新单元1708从在步骤S601获得的复述知识集合[P]获得一个复述知识(此后称作Pu)(步骤S1904)。随后,复述知识更新单元1708将获得的复述知识Pu应用于以前的源语言句子,从而输出相应的源语言复述句子(此后称作Su)(步骤S1905)。
这里,该以前的源语言句子单元不是恰好在步骤S1809之前由用户重新输入的源语言句子Si,而是在步骤S1801或步骤S1809处输入的源语言句子。这是因为,为了降低输出与未被用户采用的源语言复述句子相同的源语言复述句子的复述知识的优先级,需要通过应用相对于该前一个源语言的复述知识从而确定,其中所述前一个源语言是对应于未被用户采用的源语言复述句子的源语言。如果用户采用了该源语言复述句子,那么所述以前的源语言句子也就符合用户恰好在此之前所重新输入的源语言句子Si。
接下来,复述知识更新单元1708确定在复述处理中使用的源语言复述句子Sp是否与在步骤S1905输出的源语言复述句子Su相符(步骤S1906)。如果句子Sp与句子Su不符(步骤S1906否),那么操作返回到处理以获得下一个复述知识并且重复该处理,而不更新优先级(步骤S1904)。
如果句子Sp与句子Su相符(步骤S1906是),那么复述知识更新单元1708将更新优先级u加入到复述知识Pu的优先级(步骤S1907)。接下来,复述知识更新单元1708用计算得到的优先级更新存储在复述知识存储单元121中的复述知识Pu的优先级(步骤S1908)。
从而,不仅可以更新对应于用户所采用的源语言复述句子的复述知识,而且可以更新能够输出与该复述知识相同的源语言复述句子的复述知识的优先级。
接下来,复述知识更新单元1708确定是否对复述知识集合[P]中的所有复述知识都进行了处理(步骤S1909)。如果未处理所有复述知识(步骤S1909否),那么复述知识更新单元1708就获得下一个复述知识并且重复这些处理(步骤S1904)。如果处理完了所有复述知识(步骤S1909是),那么就结束复述知识更新处理。
现在,描述第三实施例中交流支持处理的一个具体例子。这里,与第二实施例中的具体例子一样,假设如图14所示的复述知识已经登记到复述知识存储单元121。
如同第二实施例所示的具体例子,假设将如图15所示的源语言复述句子1306提供给用户,并且用户确定源语言复述句子1306与语音意图不符,并且重新输入如图16所示的源语言句子1401(步骤S1809)。
在这种情况下,复述知识更新单元1708确定重新输入的复述句子与通过复述处理生成的源语言复述句子不同(步骤S1812否),并且将复述采用标记被设置为“OFF”(步骤S1814),然后执行复述知识更新处理(步骤S1815)。
因为复述采用标记被设置为“OFF”,所以在复述知识更新处理中,更新优先级u被设置为值“-1”(步骤S1903)。图22是显示此时的复述知识集合[P]的例子的示意图。如图中所示,复述知识集合[P]仅包含一个元素;因此,就获得了如图22中所示的的复述知识2001作为复述知识Pu(步骤S1904)。
因为复述知识Pu与复述处理中所使用的复述知识相同,所以这符合通过应用复述知识Pu从而输出的源语言复述句子Su和在复述处理中输出的源语言复述句子Sp(步骤S1906是)。
因此,将值u(=-1)加入到复述知识Pu的优先级(步骤S1907),并且更新复述知识存储单元121中相应的复述知识的优先级(步骤S1908)。因为更新优先级为负值,所以这些操作就意味着会降低优先级。
图23是显示通过上述处理对复述知识存储单元121进行更新之后的情况的例子的示意图。如图所示,与图14指示了更新之前的复述知识存储单元121的复述知识1201相比,相应的复述知识2101的优先级得到了更新。另一方面,在上述例子中的复述处理中未被参考的复述知识2102则没有被更新。
接下来描述一个例子,其中假设如图24中所示的复述知识已经登记到复述知识存储单元121中,并且如图10所示的输入记录已经存储到输入记录存储单元722。图24是显示存储在复述知识存储单元121中的数据的例子的示意图。而且,图25是一个示意图,显示了在该例子中在交流支持处理中输出的数据的例子。
首先,输入接受单元101接受源语言句子的输入(步骤S1801)。这里,假设接受了如图25中所示的源语言句子2301的输入。源语言分析单元102分析源语言句子2301(步骤S1803),从而输出语素序列2302和语法结构2303。
而且,翻译单元103执行翻译处理从而输出目标语言句子2304(步骤S1804)。此时,同时输出指示了翻译处理成功或失败的翻译结果2305。在该例子中,所输出的翻译结果2305指示了翻译是失败的,并且仅部分地被执行,因此仅生成了部分译文。
从而,用户可以确认源语言句子1301,也就是他的语音,未被正确地翻译为作为目标语言英语,并且确定翻译不正确。此后,输入接受单元101确定在步骤S1806处未接受到指示翻译成功的输入(步骤S1806否),然后执行复述处理(步骤S1807)。
在复述处理中,通过参考复述知识存储单元121,对应于源语言句子2301的语素序列Sm和语法结构Sa将满足前项部分的复述知识加入到复述知识集合[P](步骤S601)。图26是显示按照上述方式提取的复述知识的例子的示意图。
假设从包含在图26中所示的复述知识集合[P]中的复述知识中获得了复述知识2401,作为具有最高适用性的复述知识Px(步骤S603)。
通过将获得的复述知识Px应用于源语言句子从而生成如图25所示的源语言复述句子2306(步骤S604)。
如果源语言复述句子2306的翻译处理失败(步骤S606否),那么就通过按次序参考复述知识集合[P]中的可应用的复述知识Px从而执行源语言复述句子的生成处理,并且一直重复该处理直到翻译成功(步骤S606是)或者不存在可应用的复述知识(步骤S609)。这里,假设翻译处理成功。
接下来,如果用户选择将源语言复述句子2306作为源语言句子,或者如果用户说出的源语言句子与源语言复述句子2306相同,并且输入了该语音,那么就接受源语言复述句子2306的输入,作为源语言句子(步骤S1809)。
在这种情况下,重新输入的源语言句子符合源语言复述句子2306(步骤S1812是),因此复述采用标记被设置为“ON”(步骤S1813),并且执行复述知识更新处理(步骤S1815)。
在复述知识更新处理中,因为复述采用标记被设置为“ON”(步骤S1901是),所以复述知识更新单元1703将更新优先级u设置为1(步骤S1902)。
而且,因为复述知识集合[P]包含多个元素,所以复述知识更新单元1708将按次序获得的复述知识Pu应用到源语言句子,从而更新复述知识的优先级,其中输出的源语言复述句子Su符合源语言复述句子2306(步骤S1904到步骤S1909)。在该例子中,更新优先级被设置为正值,因此这就意味着提高优先级。
图27是显示通过上述处理更新后的复述知识存储单元121的例子的示意图。与图24所示的更新之前的复述知识存储单元121中的复述知识相比,复述知识2501、2502、2503和2504的优先级被更新。
在复述知识更新处理之后,通过将重新输入的源语言句子作为新的源语言句子来重复该处理。图28是显示交流支持装置输出的数据的例子的示意图。
源语言分析单元102对图中所示的重新输入源语言句子2601进行分析(步骤S1803),从而输出语素序列2602和语法结构2603。
此外,翻译单元103执行翻译处理从而输出目标语言句子2604(步骤S1804)。此时,同时输出指示了翻译处理是成功还是失败的翻译结果2605。在该例子中,指示了翻译成功的翻译结果被输出。
从而,用户可以确定源语言句子1301,也就是他的语音,被正确地翻译为目标语言英语。此后,输入接受单元101在步骤S1806处接受指示了翻译成功的输入(步骤S1806是),然后由输出单元106执行目标语言句子To的语音输出处理(步骤S1816)。接下来,执行复述知识提取处理,但是因为在该例子中重新输入并未改变语音,所以并未提取新的复述知识(步骤S1818)。
如上所述,在根据第三实施例的交流支持装置中,当用户选择所提供的源语言复述句子时,可以通过存储复述知识和表示应用复述知识的优先顺序的优先级(其中该复述知识和优先级是相互联系的),并且通过提高对应于源语言复述句子的复述知识的优先级,或者降低生成未被采用的源语言复述句子的复述知识的优先级,从而应用具有优先级的更合适的复述知识。因此,可以提供很好地适合于用户的语音倾向的复述。
根据第一实施例到第三实施例的交流支持装置中所执行的交流支持程序可以预先包含在ROM(只读存储器)等等中从而被提供。
在根据第一实施例到第三实施例的交流支持装置中执行的交流支持程序可以存储在可由计算机读取的记录介质中,例如CD-R(压缩盘只读存储器)、软盘(FD)、CD-R(可记录压缩盘)、DVD(数字万能盘)等等,并且该程序以可被安装或执行的文件的形式存在,从而提供该程序。
而且,根据第一实施例到第三实施例的交流支持装置中所执行的交流支持程序可以被存储在连接到网络(例如因特网)的计算机中,并且通过网络下载该程序。而且,可以通过网络(例如因特网)提供或分发根据第一实施例到第三实施例的交流支持装置中所执行的交流支持程序。
根据第一实施例到第三实施例的交流支持装置中所执行的每个交流支持程序都具有包含上述单元(输入接受单元、源语言分析单元、翻译单元、显示控制单元、复述单元、输出单元、复述知识提取单元以及复述知识更新单元)的模块化结构。而且,作为实际的硬件的CPU(中央处理单元)从上述记录介质中读取交流支持程序并且执行该程序,然后上述单元被加载到一个主存储设备上,从而在主存储设备上生成所述单元。
本领域的技术人员可以容易地知道其它优点和变化形式。因此,本发明并不限于上述具体细节和典型实施例。因此,在不脱离由所附权利要求和它们的等价内容所规定的本发明的精神或范围的情况下,可以实现多种变化形式。
权利要求
1.一种交流支持装置,包含输入接受单元,用于接受由用户输入的待翻译的源语言句子;复述知识存储单元,用于存储复述知识,在所述复述知识中,作为所述源语言句子的语义内容的解释的源语言解释与复述解释相关联,该复述解释与所述源语言解释具有相同的语义内容和不同的表达形式;源语言分析单元,用于分析所述输入源语言句子的语义内容并且输出所述源语言解释;复述单元,用于从所述复述知识存储单元获得与所述输出源语言解释相关联的复述解释,并且根据所述获得的复述解释将所述输入源语言句子复述为源语言复述句子;以及翻译单元,用于将所述输出源语言解释翻译成第一目标语言句子并且将所述获得的复述解释翻译成第二目标语言句子。
2.如权利要求1所述的交流支持装置,其中所述输入接受单元接受由所述用户从重新输入句子中选择的一个重新输入句子,重新输入句子是被复述的以及由所述用户输入的源语言句子(所述重新输入句子是由所述用户输入的源语言句子的被复述并被输入的源语言句子,但是对照下面及根据意思判断,应为两种类型的句子),并且所述交流支持装置还包含输入记录存储单元,用于存储关于由用户输入的所述源语言句子的所述源语言解释,以及作为关于所述重新输入句子的源语言解释的重新输入解释,其中,通过将所述源语言解释和所述重新输入解释相关联来进行存储;以及复述知识提取单元,用于通过将选择的解释与关于所述源语言句子的所述源语言解释或除所述选择的解释以外的重新输入解释相关联,从所述输入记录存储单元提取所述复述知识,从而将所述复述知识登记到所述复述知识存储单元,其中,所述选择的解释是关于所述输入接受单元接受了由所述用户做出的选择之后的,重新输入句子的重新输入解释。
3.如权利要求1所述的交流支持装置,其中所述复述知识存储单元存储有表示应用所述复述知识时的优先顺序的优先级,其中,通过将所述优先级与所述复述知识相关联来进行存储,并且所述交流支持装置还包含复述知识更新单元,用于根据所述复述知识的采用状态来改变所述优先级。
4.如权利要求3所述的交流支持装置,其中,所述复述知识更新单元使得产生不同于由所述用户选择的重新输入句子的源语言复述句子的复述知识的优先级低于选择之前的优先级,以及使得产生与由所述用户选择的重新输入句子相同的源语言复述句子的复述知识的优先级高于所述选择之前的优先级。
5.如权利要求3所述的交流支持装置,其中,当存在多个与所述输出的源语言解释相关联的复述解释时,所述复述单元从所述复述知识存储单元获得与具有最高优先级的复述知识相关联的复述解释,并且根据所述获得的复述解释将所述输入源语言句子复述为源语言复述句子。
6.如权利要求3所述的交流支持装置,其中,当存在多个与所述输出的源语言解释相关联的复述解释时,所述复述单元按照优先级的降序从所述复述知识存储单元获得与预定数量的复述知识相关联的复述解释,并且根据所述获得的复述解释将所述输入源语言句子复述为源语言复述句子。
7.如权利要求1所述的交流支持装置,其中所述复述知识存储单元存储有复述知识,其中,作为所述待翻译的源语言句子的形态分析的结果的语素序列与复述语素序列相关联,所述复述语素序列具有与由所述语素序列表示的语义内容相同的语义内容以及不同的表达形式,所述源语言分析单元输出所述语素序列,作为所述源语言解释,所述语素序列是所述输入源语言句子的形态分析的结果,所述复述单元从所述复述知识存储单元获得与所述语素序列相关联的复述语素序列,并且根据所述获得的复述语素序列将所述输入源语言句子复述为源语言复述句子,以及所述翻译单元将所述输出语素序列翻译成所述第一目标语言句子,并且将所述获得的复述语素序列翻译成所述第二目标语言句子。
8.根据权利要求1所述的交流支持装置,其中所述复述知识存储单元存储有所述复述知识,其中,作为所述待翻译的源语言句子的语法分析的结果的语法结构与复述语法结构相关联,所述复述语法结构具有与由所述语法结构表示的语义内容相同的语义内容以及不同的表达形式,所述源语言分析单元输出所述语法结构,作为所述源语言解释,所述语法结构是所述输入源语言句子的语法分析的结果,所述复述单元从所述复述知识存储单元获得与所述语法结构相关联的复述语法结构,并且根据所述获得的复述语法结构将所述输入源语言句子复述为源语言复述句子,以及所述翻译单元将所述输出语法结构翻译成所述第一目标语言句子,并且将所述获得的复述语法结构翻译成所述第二目标语言句子。
9.一种交流支持方法,包括接受由用户输入的待翻译的源语言句子;分析所述输入源语言句子的语义内容;输出源语言解释;从复述知识存储单元获得与所述输出源语言解释相关联的复述解释,所述复述知识存储单元将所述源语言解释和所述复述解释相互关联进行存储,所述复述解释具有与所述源语言解释相同的语义内容和不同的表达形式,根据所述获得的复述解释将所述输入源语言句子复述为源语言复述句子;将所述输出源语言解释翻译成第一目标语言句子并且将所述获得的复述解释翻译成第二目标语言句子。
全文摘要
一种交流支持装置,包含输入接受单元,用于接受由用户输入的待翻译的源语言句子;复述知识存储单元,用于存储复述知识,在所述复述知识中,作为所述源语言句子的语义内容的解释的源语言解释与复述解释相关联,该复述解释与所述源语言解释具有相同的语义内容和不同的表达形式;源语言分析单元,用于分析所述输入源语言句子的语义内容并且输出所述源语言解释;复述单元,用于从所述复述知识存储单元获得与所述输出源语言解释相关联的复述解释,并且根据所述获得的复述解释将所述输入源语言句子复述为源语言复述句子;以及翻译单元,用于将所述输出源语言解释翻译成第一目标语言句子并且将所述获得的复述解释翻译成第二目标语言句子。
文档编号G06F17/28GK1892643SQ200610094150
公开日2007年1月10日 申请日期2006年6月27日 优先权日2005年6月27日
发明者釜谷聪史, 知野哲朗 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1