语音传译装置、语音传译方法及语音传译程序的制作方法

文档序号:8430708阅读:266来源:国知局
语音传译装置、语音传译方法及语音传译程序的制作方法
【专利说明】
[0001] 申请以日本专利申请2013-267918 (申请日:2014年12月25日)为基础,享受该 申请的优先权。本申请通过参照该申请,包含该申请的全部内容。
技术领域
[0002] 实施方式涉及伴随语音传译技术的用例检索技术。
【背景技术】
[0003] 近年,伴随文化及经济的全球化,以不同语言为母语的人彼此交流的机会持续增 大。因此,相关的交流辅助用的自动传译技术备受关注。特别地,作为语音识别技术、自然 语言处理技术及机器翻译技术的应用例的语音传译技术,将语音输入的第1语言的原文机 器翻译为第2语言的译文,将该译文呈现给说话者的对话方。若利用相关的语音传译技术, 则以不同语言为母语的人彼此可以采用各自的母语容易地进行基于语音的交流。
[0004] 伴随语音传译技术,用例检索技术也得到灵活运用。用例检索技术从预先准备的 多个用例中,检索与语音输入的第1语言的原文意义相似的一个以上的用例。检索到的相 似用例被呈现给说话者。若说话者选择所呈现的相似用例中的一个,则所选择的相似用例 的对译用例被呈现给说话者的对话方。从而,即使是原文的语音识别结果不正确的情况,只 要说话者可以选择适当的相似用例,便不必重说也可以正确传达自己的意思。相关的用例 检索技术中,重要的是向说话者优先地呈现适当的(即,适合说话者的意思的可能性高的) 用例。

【发明内容】

[0005] 实施方式的目的在于呈现适当的用例。
[0006] 根据实施方式,语音传译装置具备语音识别部、机器翻译部、第1存储部、提取部、 赋予部、第2存储部、检索部、计算部和排序部。语音识别部通过对当前的发话语音进行语 音识别处理而生成当前的语音识别结果。机器翻译部通过将当前的语音识别结果从第1语 言机器翻译为第2语言而生成当前的机器翻译结果。第1存储部存储形成当前对话的一个 以上的发话的各个的对话历史。提取部通过从文本组提取短语而获得短语集合,所述文本 组包含当前的语音识别结果和对话历史中包含的过去的语音识别结果及机器翻译结果。赋 予部对属于短语集合的每个短语,赋予权重,该权重依赖于成为出现该短语的文本的基础 的发话语音所关联的对话状态与当前的对话状态的差别。第2存储部存储多个第1语言的 用例和该多个第1语言的用例的各个所关联的第2语言的对译用例。检索部通过从多个第 1语言的用例检索包含短语集合中包含的任一短语的用例而获得命中用例集合。计算部对 命中用例集合中包含的每个命中用例,计算与当前的语音识别结果的相似度。排序部基于 权重及相似度计算命中用例集合中包含的每个命中用例的得分,基于该得分对命中用例集 合中包含的命中用例进行排序。
[0007] 根据上述构成的语音传译装置,可以呈现适当的用例。
【附图说明】
[0008] 图1是例示第1实施方式所涉及的语音传译装置的方框图。
[0009] 图2是例示图1的对话历史存储部中存储的对话历史的图。
[0010] 图3是例示发话语音的内容、该发话语音的语音识别结果和该语音识别结果的机 器翻译结果的图。
[0011] 图4是例示图1的短语提取部提取的短语集合的图。
[0012] 图5是例示对属于图4所例示的短语集合的每个短语赋予的权重的图。
[0013]图6是例示由图1的用例检索部检索的命中用例、该命中用例的权重得分、相似度 得分及检索得分的图。
[0014] 图7是例示由图1的用例排序部进行的命中用例的排序结果的图。
[0015] 图8是表示由图1的呈现部进行的命中用例及机器翻译结果的显示例的图。
[0016] 图9是例示图1的语音传译装置的工作的流程图。
[0017] 图10是例示图9的用例检索处理的流程图。
[0018] 图11是例示图1的对话历史存储部中存储的对话历史的图。
[0019] 图12是例示发话语音的内容、该发话语音的语音识别结果和该语音识别结果的 机器翻译结果的图。
[0020] 图13是例示由第2实施方式所涉及的语音传译装置中的短语提取部提取的短语 集合的图。
[0021] 图14是例示由第2实施方式所涉及的语音传译装置中的短语提取部从图11所例 示的机器翻译结果的第2位的候选文本及图12所例示的语音识别结果的第2位的候选文 本进一步提取的短语集合的图。
[0022] 图15是例示对属于图13或图14所例示的短语集合的每个短语赋予的权重的图。
[0023] 图16是例示由第2实施方式所涉及的语音传译装置中的用例检索部检索的命中 用例和该命中用例的权重得分、相似度得分及检索得分的图。
[0024] 图17是例示由第2实施方式所涉及的语音传译装置中的用例排序部进行的命中 用例的排序结果的图。
【具体实施方式】
[0025] 以下,参照图面进行实施方式的说明。此外,以下,对与已经说明的要素相同或相 似的要素标注相同或相似的符号,且重复的说明基本上省略。
[0026] 以下的说明中,设为说话者A使用英语,说话者B使用日语。但是,说话者A及说 话者B不限于此,可以使用各种语言。
[0027] (第1实施方式)
[0028] 如图1所例示,第1实施方式所涉及的语音传译装置100具备:输入部101;语音 识别部102;机器翻译部103;短语提取部104;权重赋予部105;用例检索部106;相似度计 算部107;用例排序部108;对话用例存储部109;呈现部110;对话历史存储部111。
[0029] 输入部101以数字语音信号的形式输入说话者的发话语音。作为输入部101,可以 采用例如麦克风等现有的语音输入装置。输入部101将数字语音信号向语音识别部102输 出。
[0030] 语音识别部102从输入部101输入数字语音信号。语音识别部102通过对数字语 音信号进行语音识别处理,生成表示上述发话语音的内容的文本形式的语音识别结果。例 如在说话者A发话"Itwasagreenbag."的内容的情况下,语音识别部102可能生成与 该发话内容完全一致的语音识别结果,也可能如图3所示的"Itwasagreenback."那样 生成部分错误的语音识别结果。
[0031] 语音识别部102例如可以利用LPC(Linear Predictive Coding :线性预测编码) 分析、隐马尔可夫模型(HMM:Hidden Markov Model)、动态规划、神经网络、N-gram语言模型 等各种技术,进行语音识别处理。语音识别部102将当前的语音识别结果向机器翻译部103 及短语提取部104输出。
[0032] 机器翻译部103从语音识别部102输入当前的语音识别结果。机器翻译部103通 过将作为第1语言(也可以称为源语言)的文本的语音识别结果机器翻译为第2语言(也 可以称为目标语言)的文本,生成文本形式的机器翻译结果。如图3所例示,在语音识别结 果为"It was a green back?"的情况下,机器翻译部103可能生成"緑?後部"?、L fc。"这 样的机器翻译结果。
[0033] 机器翻译部103例如可以利用转换方式、基于用例的方式、基于统计的方式、中间 语言方式等一般的机器翻译系统中利用的各种技术,进行机器翻译处理。机器翻译部103 将当前的机器翻译结果向呈现部110输出。
[0034] 通过后述的呈现部110,形成当前对话的一个以上发话的各个的对话历史按该发 话在当前对话中的发生顺序被写入对话历史存储部111。这里,所谓对话,相当于按发生顺 序排列的一个以上发话的序列。特别地,在相当于当前对话的序列中,发生顺序最新的要素 是当前的发话,除此以外的要素是过去的发话。
[0035] 对话历史存储部111以数据库形式存储所写入的对话历史。对话历史例如包含标 识对应的发话语音的说话者的信息、该发话语音的语音识别结果、该语音识别结果的机器 翻译结果及取代该机器翻译结果而选择的用例及其对译用例(这些详细情况将后述)中一 部分或全部的要素。例如,在对话历史存储部111,存储图2所示的对话历史。在对话历史 存储部111存储的对话历史由短语提取部104及权重赋予部105根据需要而读出。
[0036] 短语提取部104从语音识别部102输入当前的语音识别结果。短语提取部104进 而从对话历史存储部111读出对话历史。具体地,短语提取部104输入对话历史中所包含 的过去的第1语言的发话语音的语音识别结果以及过去的第2语言的发话语音的语音识别 结果的第1语言的机器翻译结果。短语提取部104通过从包含这些语音识别结果及机器翻 译结果的文本组提取短语,获得短语集合。短语提取部104将短语集合向权重赋予部105 输出。
[0037] 短语提取部104例如可以利用词素解析、单词词典等来提取短语。此外,例如也可 以将英语中的"the"、"a"这样在任何句子中都共同出现的一般(非特征)单词登记为停止 词。短语提取部104通过将停止词排除后提取短语,可以调整使得属于短语集合的短语数 不会过大。
[0038] 例如,短语提取部104通过从图2及图3所示的说话者A的发话语音的语音识别 结果以及图2所示的说话者B的发话语音的语音识别结果的机器翻译结果提取短语,获得 图4所示的短语集合。具体地,短语提取部104从说话者B的过去的发话语音的语音识别 结果的机器翻译结果提取"color"等短语,从说话者A的过去的发话语音的语音识别结果 提取"lost"等短语,从说话者A的当前发话语音的语音识别结果提取"green"等短语。
[0039] 权重赋予部105从短语提取部104输入短语集合,从对话历史存储部111读出对 话历史。权重赋予部105对属于短语集合的每个短语,赋予权重,该权重依赖于成为出现 该短语的文本(即,语音识别结果或机器翻译结果)的基础的发话语音所关联的对话状态 (例如,该发话语音的说话者、该发话语音在当前对话中的发生顺序)与当前对话状态的差 别。
[0040] 此外,权重赋予部105,在短语遍及多个文本而出现的情况下,通过将依赖于成为 该多个文本的各个的基础的发话语音所关联的对话状态与当前对话状态的差别的权重进 行合计,可以计算对该短语赋予的权重。权重
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1