语音翻译装置、方法及程序的制作方法_2

文档序号:9667311阅读:来源:国知局
列还是应该继续句子的词素列。例如,如果作为带条件概率的P(B|up,today,<ρ?的值比Ρ (I I up,today,
)的值大,则能够判定为是分割位置(翻译单位)。因此,生成的前段部分即字符串“cuz time’s up today”作为翻译单位字符串。
[0045]接着,参照图4说明由语句变换部104参照的变换辞典的一例。
[0046]图4表示存储补白词401和口语表达402及书面语表达403的一览的变换辞典。例如,作为补白词401,在变换辞典中预先存储“九一”、“;I一o t ”,如果在翻译单位字符串中包含“九一”、“;1 — 0 t ”这样的单词,则语句变换部104从翻译单位字符串删除对应的单词。
[0047]另外,如果口语表达402与翻译单位字符串中的口语表达一致,则将口语表达402改变为书面语表达403。例如,如果口语表达402 “cuz”包含在翻译单位字符串中,则将口语表达402 “cuz”变换为书面语表达403 “Because”。
[0048]接着,参照图5的流程图说明第1实施方式所涉及的语音翻译装置100的工作。
[0049]这里,表示到显示部106显示变换字符串及翻译字符串为止的处理。另外,假定语音取得部101依次取得语音,语音识别部102依次进行语音信号的语音识别处理。
[0050]在步骤S501,语音识别部102初始化用于存储识别结果字符串的缓冲器。缓冲器既可以包含在语音识别部102,也可以利用外部的缓冲器。
[0051]在步骤S502,语音识别部102判定语音识别处理是否完成。这里,所谓语音识别处理完成,指语音识别处理完成而随时能够将所确定的部分的识别结果字符串向翻译单位检测部103输出的状态。在语音识别处理完成了的情况下前进至步骤S503,在语音识别处理未完成的情况下前进至步骤S506。
[0052]在步骤S503,语音识别部102将新生成的识别结果字符串连结于缓冲器中存储的识别结果字符串。另外,在最初的处理等中缓冲器为空的情况下,直接存储识别结果字符串ο
[0053]在步骤S504,翻译单位检测部103从缓冲器接收识别结果字符串,从识别结果字符串尝试检测翻译单位。在翻译单位的检测成功了的情况下前进至步骤S505,在翻译单位的检测失败即不存在翻译单位的情况下,返回步骤S502,反复同样的处理。
[0054]在步骤S505,翻译单位检测部103基于检测到的翻译单位,生成翻译单位字符串。
[0055]在步骤S506,语音识别部102判定经过时间是否在阈值时间以内。经过时间是否在阈值时间以内只要在语音识别部102中,例如通过计时器等计测从生成识别结果字符串起的经过时间,并判定经过时间是否在阈值以内即可。如果经过时间在阈值时间以内,则返回步骤S502,反复同样的处理。如果经过时间比阈值时间大,则前进至步骤S507。
[0056]在步骤S507,翻译单位检测部103取得缓冲器中存储的识别结果字符串作为翻译单位字符串。
[0057]在步骤S508,语句变换部104从翻译单位字符串删除不必要词语,将口语表达变换为书面语表达,生成变换字符串。
[0058]在步骤S509,机器翻译部105将变换字符串从第1语言翻译为第2语言,生成翻译字符串。
[0059]在步骤S510,显示部106将变换字符串与翻译字符串相对应地显示。以上,第1实施方式所涉及的语音翻译装置100的工作结束。
[0060]接着,参照图6说明识别结果字符串的生成定时和翻译单位的检测定时。
[0061]图6的上部是语音识别结果即识别结果字符串。图6的下部是翻译单位字符串,表不沿时序的检测定时。
[0062]语音识别部102在用户暂停发言、经过阈值以上的时间(例如,检测200毫秒以上的暂停期间)时,可以确定之前的语音识别结果,输出语音识别结果。这里,如图6所示,若在t2、t3、t4、〖5及16检测到暂停期间,则语音识别部102确定识别结果字符串。
[0063]即,翻译单位检测部103分别在t2接收期间601中的识别结果字符串,在13接收期间602中的识别结果字符串,在t5接收期间603中的识别结果字符串,在16接收期间604中的识别结果字符串。
[0064]另一方面,在翻译单位检测部103中,有能够将所取得的识别结果字符串检测为翻译单位的情况和不能够将所取得的识别结果字符串检测为翻译单位的情况。
[0065]例如,期间601中的识别结果字符串“cuz time’s up today”由于能够通过图3中上述的处理判定为翻译单位,所以能够生成为翻译单位字符串611。但是,在期间602中的识别结果字符串“Hmm,Let’s have a next meeting”中,虽然有暂停,但是由于句子的联结是否已切断不清楚,所以无法判定为翻译单位。
[0066]因而,不确定为翻译单位字符串,直到能够利用下一期间603的语音识别结果为止,如图5所示的步骤S503那样,在t5的时刻,将连结期间602的识别结果字符串与期间603的识别结果字符串的字符串作为对象进行处理。由此,能够检测翻译单位,能够生成翻译单位字符串 612 “hmm let’s have a next meeting on Monday,,。
[0067]另外,检测翻译单位的结果,有时会将识别结果字符串的后半部分判定为应该作为后续的翻译单位。例如,在生成了翻译单位字符串612的时刻,在期间605生成的识别结果字符串“er”由于不被判定为翻译单位,所以等待到后续的语音识别结果能够利用为止。在t6的时刻,将连结期间604的识别结果字符串与期间605的识别结果字符串的字符串检测为翻译单位字符串613 “er is that OK for you”。
[0068]这样,翻译单位检测部103通过按时序顺序依次读入由语音识别部102生成的识别结果字符串,检测翻译单位而生成翻译单位字符串。另外,在图6中,假定在检测到暂停的情况下生成语音识别结果的情况,但是语音识别部102也可以在检测到无歧义的语言要素的情况下确定为识别结果字符串。
[0069]接着,参照图7说明由语音翻译装置的各部分输出的字符串的具体例。
[0070]如图7 所不,假定从用户取得了语音 701“Cuz time’s up today.Hmm, Let’s havea next meeting on Monday.1s that OK for you ? ”。
[0071]语音识别部102通过对语音701进行语音识别处理,获得识别结果字符串702“Cuztime’s up today.Hmm, Let's have a next meeting on Monday.1s that OK for you?,,。
[0072]接着,翻译单位检测部103通过对识别结果字符串702检测翻译单位,生成3个句子“cuz time’s up today,,、‘‘hmm let’s have a next meeting on Monday,,、“Is that OKfor you”,作为翻译单位字符串703。
[0073]接着,语句变换部104对翻译单位字符串703,删除补白词“hmm”,将口语表达“cuz”变换为书面语表达“Because”,生成变换字符串704 “Because time’s up today.”、“Let’s have a next meeting on Monday.”、“Is that OK for you ? ”。
[0074]最后,机器翻译部105将变换字符串704从第1语言翻译为第2语言。这里,从英语翻译为日语,生成翻译字符串705“今日?;時間切札* ? τ、。”、“月曜日(乙次?会議奁持朽^ L J: 3。”、“大丈夫3 扣? ”。
[0075]接着,参照图8说明显示部106中的显示例。
[0076]如图8所示,作为某用户的发言,变换字符串“議論才< ?項目?:他(二态*9圭才力〉? ” 和对应的翻译字符串 “Do you have any other items to be discussed ?” 以一组显示在气球形框801。作为与之相对的另一用户的发言,气球形框802、气球形框803及气球形框804沿时序在生成翻译字符串的定时显示。例如,变换字符串“Because time’s uptoday.”和对应的翻译字符串“今日時間切札々? T ”作为一
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1