语音翻译装置、方法及程序的制作方法_4

文档序号：9667311阅读：来源：国知局

]在本实施方式中，在语音取得部101中，取得来自用户的发言，在语音翻译服务器910的语音识别部102中，边将语音识别结果即识别结果字符串存储在缓冲器，边通过翻译单位检测部103从前方开始进行翻译单位的检测。因此，在显示部106，翻译字符串的显示有可能产生时滞。
[0121]因而，如图14所示，也可以在获得了识别结果字符串的时刻，在从生成翻译单位字符串起到生成翻译字符串为止的期间，在显示区域1401显示识别结果字符串。由此，能够减小识别结果字符串的显示的时滞。进而，在获得了翻译字符串的情况下，也可以删除在显示区域1401显示的识别结果字符串。
[0122]接着，参照图15说明显示部106中的显示的第2其他例。
[0123]例如，对于在语音会议等中完全无法理解对方语言的用户，也考虑不必显示对方语言的情况。因而，只要将作为对方语言的变换字符串或翻译字符串设为非显示即可。如图15所示，只要在母语为英语的用户的情况下，在气球形框1501显示英语，在母语为日语的用户的情况下，在气球形框1502显示日语即可。
[0124]另一方面，在能够在某种程度上理解对方语言但是听写能力没那么高的用户的情况下，也可以将翻译字符串设为非显示，而显示变换字符串。
[0125]另外，在上述的第2实施方式中，语音识别部102、语句变换部104及机器翻译部105包含于语音翻译服务器910，但是也可以包含于终端920。但是，在假定支持使用了 2种以上的语言的会话的情况下，期望至少机器翻译部105包含于语音翻译服务器910。
[0126]另外，也可以不使用语音翻译服务器910，而由成为包含上述的语音翻译服务器910的构成和终端920的构成的语音识别装置的终端彼此进行处理。由终端彼此进行通信的情况下的终端的方框图示于图16。
[0127]终端1600包含语音取得部101、语音识别部102、翻译单位检测部103、语句变换部104、机器翻译部105、显示部106、数据存储部911、服务器通信部912、指示取得部921、语音输出部922及终端通信部923。由此，通过终端1600彼此进行通信，能够进行与语音对话系统同样的处理，能够实现点对点(P2P)系统。
[0128]根据以上所示的第2实施方式，能够根据用户的指示，输出与变换字符串及翻译字符串对应的部分语音信号。另外，能够选择与用户的理解水平相应的显示，能够进行顺畅的语音对话。
[0129]上述的实施方式中表示的处理步骤所示的指示可以基于作为软件的程序而执行。通用的计算机系统通过预先存储该程序并读入该程序，也可以获得与由上述语音翻译装置实现的效果同样的效果。上述的实施方式中描述的指示作为能够使计算机执行的程序，可以存储在磁盘(软盘、硬盘等)、光盘(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD土RW、Blu-ray (注册商标)Disc等)、半导体存储器或与之类似的记录介质。只要是计算机或嵌入系统可以读取的记录介质，其存储形式可以是任意的形态。计算机若从该记录介质读入程序并基于该程序由CPU执行程序所描述的指示，则能够实现与上述实施方式的语音翻译装置同样的工作。当然，在计算机取得或读入程序的情况下，也可以通过网络取得或读入。
[0130]另外，基于从记录介质安装到计算机和/或嵌入系统的程序的指示而在计算机上工作的0S(操作系统)和/或数据库管理软件、网络等MW(中间件)等也可以执行用于实现本实施方式的各处理的一部分。
[0131]进而，本实施方式中的记录介质不限于与计算机或者嵌入系统独立的介质，也包含下载并存储或暂时存储通过LAN和/或因特网等传递的程序的记录介质。
[0132]另外，记录介质不限于一个，在从多个介质执行本实施方式中的处理的情况也包含在本实施方式中的记录介质，介质的构成可以是任意的构成。
[0133]另外，本实施方式中的计算机或嵌入系统是用于基于记录介质中存储的程序来执行本实施方式中的各处理的装置，可以是包括个人计算机、微计算机等一个设备的装置、多个装置进行网络连接而成的系统等任意的构成。
[0134]另外，本实施方式中的计算机不限于个人计算机，也包含信息处理设备所包含的运算处理装置、微计算机等，是可以通过程序实现本实施方式中的功能的设备、装置的总称。
[0135]虽然说明了本发明的几个实施方式，但是这些实施方式是作为例子而呈现的，而并非要限定发明的范围。这些新实施方式能够以其他各种方式实施，在不脱离发明的主旨的范围，可以进行各种省略、置换、改变。这些实施方式和/或其变形包含于发明的范围和/或主旨，并且包含于权利要求的范围所记载的发明及其均等的范围。
【主权项】
1.一种语音翻译装置，其特征在于，具备: 语音识别部，其对基于第1语言的语音进行语音识别，生成识别结果字符串；检测部，其从上述识别结果字符串检测适于翻译的翻译单位，生成基于该翻译单位将该识别结果字符串分割后的翻译单位字符串；变换部，其将上述翻译单位字符串变换为适于机器翻译的表达即变换字符串；以及翻译部，其将上述变换字符串翻译为与上述第1语言不同的第2语言，生成翻译字符串ο2.权利要求1所述的语音翻译装置，其特征在于，上述变换部删除上述翻译单位字符串中包含的不必要词语。3.权利要求1所述的语音翻译装置，其特征在于，上述变换部将上述翻译单位字符串中包含的口语表达变换为书面语表达。4.权利要求1所述的语音翻译装置，其特征在于，还具备: 显示部，其将上述变换字符串与上述翻译字符串相对应地显示。5.权利要求4所述的语音翻译装置，其特征在于，上述显示部在从上述翻译单位字符串被生成开始到上述翻译字符串被生成为止的期间，显示上述识别结果字符串。6.权利要求4或5所述的语音翻译装置，其特征在于，上述显示部关于上述变换字符串或上述翻译字符串，将基于上述第1语言及上述第2语言的某一方的表示设为非显示。7.权利要求1所述的语音翻译装置，其特征在于，上述检测部至少以上述语音的停顿、发言中的补白词作为线索进行检测。8.权利要求1所述的语音翻译装置，其特征在于，还具备: 语音取得部，其取得基于上述第1语言的语音作为语音信号；存储部，其存储上述语音信号、该语音信号的开始时刻、该语音信号的结束时刻、从该语音信号生成的翻译单位字符串、从该翻译单位字符串变换的变换字符串和从该变换字符串生成的翻译字符串；指示取得部，其取得来自用户的指示；以及输出部，其根据上述指示，输出与上述变换字符串或上述翻译字符串对应的区间的语音信号即部分语音信号作为语音。9.一种语音翻译方法，其特征在于，包括: 对基于第1语言的语音进行语音识别，生成识别结果字符串；从上述识别结果字符串检测适于翻译的翻译单位，生成基于该翻译单位将该识别结果字符串分割后的翻译单位字符串；将上述翻译单位字符串变换为适于机器翻译的表达即变换字符串；以及将上述变换字符串翻译为与上述第1语言不同的第2语言，生成翻译字符串。10.一种语音翻译程序，其用于使计算机作为以下单元起作用: 语音识别单元，其对基于第1语言的语音进行语音识别，生成识别结果字符串；检测单元，其从上述识别结果字符串检测适于翻译的翻译单位，生成基于该翻译单位将该识别结果字符串分割后的翻译单位字符串；变换单元，其将上述翻译单位字符串变换为适于机器翻译的表达即变换字符串；以及翻译单元，其将上述变换字符串翻译为与上述第1语言不同的第2语言，生成翻译字符串ο
【专利摘要】本发明的实施方式涉及语音翻译装置、方法及程序。目的在于提供能够实现顺畅的语音对话的语音翻译装置、方法及程序。本实施方式所涉及的语音翻译装置包含语音识别部、检测部、变换部及翻译部。语音识别部对基于第1语言的语音进行语音识别，生成识别结果字符串。检测部从上述识别结果字符串检测适于翻译的翻译单位，生成基于该翻译单位将该识别结果字符串分割后的翻译单位字符串。变换部将上述翻译单位字符串变换为适于机器翻译的表达即变换字符串。翻译部将上述变换字符串翻译为与上述第1语言不同的第2语言，生成翻译字符串。
【IPC分类】G10L15/00, G06F17/28
【公开号】CN105426362
【申请号】CN201510566882
【发明人】住田一男, 釜谷聪史, 阿部一彦, 长健太
【申请人】株式会社东芝, 东芝解决方案株式会社
【公开日】2016年3月23日
【申请日】2015年9月8日
【公告号】US20160078020

完整全部详细技术资料下载

当前第4页1 2 3 4