交流支援装置以及交流支援方法

文档序号:8402771阅读:548来源:国知局
交流支援装置以及交流支援方法
【专利说明】交流支援装置以及交流支援方法
[0001]本申请享受2013年12月20在先提出的日本专利申请号2013-264127的优先权,并且将其全部内容引入本申请。
技术领域
[0002]本发明的实施方式涉及交流支援装置以及交流支援方法。
【背景技术】
[0003]已知如下技术:通过声音识别将用户间的会话转换成文本,并根据需要通过机器翻译转换成其他国家语言的文本,而显示于用户所使用的终端装置。该技术例如作为在远程会议系统等中对参加会议的用户彼此的交流进行支援的技术是有用的。另外,如果利用该技术,则能够将转换成文本的会话的内容例如作为会议的会议记录进行保存,以后也能够进行参考。
[0004]在上述技术中,存在以下情况:当用户的发言中含有未登记在声音识别、机器翻译所使用的辞典中的单词时,会产生错误识别、误译,而无法适当地支援用户彼此的交流。因此,要求适当地检测出产生错误识别、误译的单词,并将正确的单词登记在辞典中。并且,要求例如从被保存为会议的会议记录的文本中适当地检测出产生错误识别、误译的单词,并修正为正确的单词。
[0005]对于从文本中提取应登记在辞典中的单词、成为修正对象的单词的方法进行了各种研究,但现有的方法未将基于会话的信息传递的成功与否作为判断材料,因此难以从交流支援的观点出发来进行适当的单词的提取。

【发明内容】

[0006]实施方式的交流支援装置为,使用辞典将用户间的会话转换成文本而显示于终端装置,该交流支援装置具备检测部、提取部以及选择部。检测部对与用户的一次发言相对应的文本单位即句子进行解析,而检测表示基于会话的信息传递失败的事件。提取部从检测出上述事件的句子中提取单词。选择部根据传递失败指标来选择由上述提取部提取的单词中、成为信息传递的失败原因的单词,上述传递失败指标根据从包含上述单词的句子中检测出的上述事件来计算。
【附图说明】
[0007]图1是远程会议系统的概略构成图。
[0008]图2是表示交流支援装置的功能性构成例的框图。
[0009]图3是示意地表示转换部所使用的辞典的一例的图。
[0010]图4是表不句子表的一例的图。
[0011]图5是表不句子显不用UI画面的一例的图。
[0012]图6是表示事件种类表的一例的图。
[0013]图7是表不事件表的一例的图。
[0014]图8是表不单词表的一例的图。
[0015]图9是表示单词修正用UI画面的一例的图。
[0016]图10是表示交流支援装置的动作的一例的流程图。
[0017]图11是表示在会议结束后显示的句子显示用UI画面的一例的图。
[0018]图12是表示在变形例中追加的事件种类表的一例的图。
[0019]图13是表示变形例的交流支援装置的动作的一例的流程图。
[0020]图14是概略地表示交流支援装置的硬件构成的一例的框图。
【具体实施方式】
[0021]以下,参照附图对实施方式的交流支援装置、交流支援方法以及程序进行详细说明。以下所示的实施方式是向远程会议系统的应用例,但能够应用本发明的系统不限于此。
[0022](远程会议系统)
[0023]图1是具备实施方式的交流支援装置的远程会议系统的概略构成图。如图1所示,远程会议系统构成为,本实施方式的交流支援装置10、会议参加者所使用的终端装置20、以及系统管理者所使用的终端装置30经由通信网络40连接。
[0024]交流支援装置10典型地是实现为具备作为通常的计算机系统的硬件构成(处理器、主存储部、辅助存储部、通信接口)的服务器装置。但是,交流支援装置10的实现方法不限于该例,也可以实现为在云系统上工作的虚拟机,还可以实现为在终端装置20、30上工作的应用程序。在本实施方式中,交流支援装置10实现为经由通信网络40在终端装置20,30之间进行基于Web的通信的、具有Web服务器的功能的服务器装置。
[0025]会议参加者所使用的终端装置20例如具备作为软件而搭载了 Web浏览器的PC(个人计算机)主体21、通过内置或者外置而与PC主体21连接的显示部22、麦克风23以及扬声器24。除此之外,作为终端装置20,例如能够利用平板终端、便携电话等作为硬件而具备显示部22、麦克风23以及扬声器24、作为软件而搭载了 Web浏览器的各种信息处理终端。系统管理者所使用的终端装置30与会议参加者所使用的终端装置20为同样的构成。
[0026]在本实施方式中,假定为:在将不同语言作为母语的会议参加者之间实施的远程会议中,利用远程会议系统。在远程会议系统中,使用终端装置20的麦克风23来取得会议参加者的发言。交流支援装置10通过声音识别将该发言转换成文本。并且,将从声音转换的文本通过机器翻译转换成其他会议参加者的母语的文本。此外,在会议中使用的语言可以是会议参加者各自的母语,也可以构成为,将预先确定的语言作为使用语言、仅使将与该使用语言不同的语言作为母语的会议参加者的发言翻译成使用语言。
[0027]在交流支援装置10中通过声音识别、机器翻译而转换的文本,通过会议参加者所使用的终端装置20的Web浏览器的功能而显示于显示部22。在本实施方式中,将与会议参加者的一次发言相对应的文本单位称为句子。在会议参加者各自使用的终端装置20的显示部22上,在会议进行的期间显示句子显示用Π画面。并且,在句子显示用Π画面上,每当存在会议参加者的发言时,与该发言相对应的句子被依次显示。并且,会议参加者的发言被从会议参加者各自使用的终端装置20的扬声器24输出声音。此外,声音的共有,可以作为交流支援装置10的一个功能来实现,也可以利用视频会议装置等其他装置、或者在终端装置20上工作的应用程序来实现。
[0028]交流支援装置10具有将与会议参加者的发言相对应的句子例如与发言的声音建立关联地保存的功能。在会议结束后,例如能够使终端装置20的显示部22在句子显示用UI画面上显示被保存的句子,能够将其利用于会议的回看等。
[0029]交流支援装置10对与会议参加者的发言相对应的句子进行解析,并检测发言的重说、重听等、推测为基于会话的信息传递失败的状况。在本实施方式中将这种状况称为事件。在信息传递失败时可能产生的几个发言模式被预先确定为事件,对各个事件赋予传递失败指标,该传递失败指标表示在信息传递失败的情况下该事件发生的程度。
[0030]之后,交流支援装置10对于检测出事件的句子进行语态素分析等而提取单词,并根据传递失败指标来选择所提取的单词中、成为信息传递的失败原因的单词。并且,交流支援装置10使单词修正用UI画面显示于会议参加者所使用的终端装置20、系统管理者所使用的终端装置30的显示部22,该单词修正用UI画面用于将所选择的单词修正为正确的单词。当从该单词修正用UI画面输入正确的单词时,交流支援装置10将该所输入的单词登记到声音识别、机器翻译所使用的辞典中,或者进行句子的修正。从检测出事件的句子提取单词、并选择成为信息传递的失败原因的单词而使终端装置20、30的显示部22显示单词修正用Π画面的定时,可以是会议中、也可以是会议结束后。
[0031](交流支援装置)
[0032]接着,关于本实施方式的交流支援装置10的详细情况,举出具体例子来进行说明。图2是表示交流支援装置10的功能性构成例的框图。如图2所示,交流支援装置10具备转换部11、句子管理部12、Π控制部13、事件检测部14、单词提取部15以及单词选择部16。
[0033]转换部11为,对于使用终端装置20的麦克风23取得的会议参加者的发言,使用辞典D进行声音识别以及根据需要进行机器翻译而转换成文本。声音识别可以构成为,从由麦克风23输入的声音中自动地检测发声区间并将其作为单个句子进行声音识别,也可以构成为,会议参加者例如从句子显示用UI画面明示地输入发声开始和结束定时并将该区间作为单个句子进行声音识别。
[0034]图3是示意地表示转换部11所使用的辞典D的一例的图。在辞典D中,对于所登记的各个单词,将原语言文本、读法以及与原语言文本相对应的翻译语言文本建立对应地保存。转换部11为,如果会议者的发言所包含的单词登记在该辞典D中,则能够使用该辞典D将该单词转换成正确的原语言文本、翻译语言文本。
[0035]句子管理部12接受转换部11的处理结果即句子,并记录到句子表Tbl中。另外,句子管理部12将从转换部11接受的句子传递给UI控制部13。
[0036]图4是表不句子表Tbl的一例的图。在句子表Tbl中,将会议参加者的发言转换成文本之后的各句子,与句子ID以及发言者的信息建立对应地保存。句子ID是对各句子赋予的固有的识别信息。发言者的信息例如能够利用在举办会议时会议主办者所登记的信息等。句子表Tbl按照每个会议来独立地制作。
[0037]在本例中,假定如下情况:在会议参加者的发言中包含有固有的服务名iiToscribe
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1