视频电话翻译系统及视频电话翻译方法

文档序号:7870746阅读:185来源:国知局
专利名称:视频电话翻译系统及视频电话翻译方法
技术领域
本发明是涉及一种可提供当使用不同语言的人士之间使用视频电话对谈时的翻译服务的视频电话翻译系统及视频电话翻译方法,特别是涉及一种例如针对语言不通的外国人,可提供政府机关、医院、警察局等行政服务而无须常驻翻译者的视频电话翻译系统及视频电话翻译方法。
背景技术
近年来,由于通信技术发达,相隔远距离的人士之间使用视频电话进行对谈已可在达实用的程度,然而为了让使用不同语言的人可流畅地对谈,需有翻译,故视频电话的翻译服务的普及颇受期待。
以往,为了接受视频电话的翻译服务,必须使用可提供视频会议服务的多点连接机构,以便在希望对谈的呼叫源、成为对谈的对象的呼叫目标、用以进行呼叫源的使用语言与呼叫目标的使用语言之间的翻译的翻译者之间设定3方通话。
图22是表示现有使用多点连接机构的视频会议服务以接受翻译服务时的系统结构。该图中,10是呼叫源的视频电话终端(以下称为呼叫源终端),20是呼叫目标的视频电话终端(以下称为呼叫目标终端),30是翻译者的视频电话终端(以下称为翻译者终端),50是公用电话线路,1是多点连接机构。各视频电话终端包含有用以拍摄使用者的摄像机(a)、用以显示已接收的影像的显示器(b)、用以拨通通话对象的拨号键盘(c)、及,由用以取得使用者声音的传声器与用以听取已接收的声音的耳机所构成的头组件(d)。由于多点连接机构1乃是用以提供视频会议服务,所以具有受理来自己预约的终端的呼叫,且合成由所连接的各终端发送的影像及声音并发送至各终端的功能。
接着,说明所述使用多点连接机构以接受翻译服务时的顺序。首先,呼叫源搜寻并呼叫可在自己使用的语言与呼叫目标使用的语言之间进行翻译的翻译者。其次,已呼叫出的翻译者依据呼叫源的委托而对呼叫目标呼叫,且决定对谈日期时间。决定对谈日期时间后,呼叫源便对多点连接机构1预约视频会议。等到所预约的日期时间,呼叫源、呼叫目标、及翻译者就由各自的视频电话终端使用登录信息向多点连接机构1登录。由此,呼叫源终端10、呼叫目标终端20、及翻译者终端30之间可开始视频会议,且由于各终端的显示器会显示已合成呼叫源的影像、呼叫目标的影像、及翻译者的影像的影像,以及各终端的头组件的耳机会输出有已合成呼叫源的声音、呼叫目标的声音、及翻译者的声音的声音,所以呼叫源与呼叫目标可一边被翻译者的翻译一边进行视频电话对谈。
然而,因为这种现有使用多点连接机构的视频电话翻译服务,必须在开始视频电话对谈之前对多点连接机构预约视频会议,所以呼叫源必须事前搜寻翻译者以联络呼叫目标,并进行用以设定视频会议的协议。
因此,所述实在难以应用在例如语言不通的外国人在紧急时欲接受政府机关、警察局、或医院等行政服务时的要求紧急应用的翻译服务。另外,还有因为翻译者必须从呼叫源与呼叫目标的事前协议的阶段开始参与,所以不得已地要长时间约束翻译者,导致翻译服务的成本亦变高的问题。

发明内容
因此,本发明的主要目的在于,提供一种呼叫源不须事前搜寻翻译者不需与呼叫目标协议,应用于紧急状况,且可令翻译者的约束时间为最小限度而减低翻译服务的成本的视频电话翻译系统及视频电话翻译方法。
本发明第1方式的视频电话翻译系统,是翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译系统,该视频电话翻译系统包含有用以连接呼叫源终端、呼叫目标终端、及翻译者终端的连接机构,及用以进行由该连接机构连接的各终端间的影像及声音的通信的通信机构,另外,连接机构具有至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,且具有受理来自呼叫源终端的呼叫的功能;自受理其呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫源的语言种类、及呼叫目标的语言种类的功能;参照翻译者登录表由已取得的呼叫源的语言种类与呼叫目标的语言种类提取翻译者的终端号码的功能;通过已提取的翻译者的终端号码来呼叫翻译者终端的功能;及,通过已取得的呼叫目标的终端号码来呼叫呼叫目标终端的功能,另外,通信机构具有对呼叫源终端发送包含至少来自呼叫目标终端的影像的影像与包含至少来自翻译者终端的声音的声音的功能;对呼叫目标终端发送包含至少来自呼叫源终端的影像的影像与包含至少来自翻译者终端的声音的声音的功能;及,对翻译者终端发送包含至少来自呼叫源终端的声音与来自呼叫目标终端的声音的声音的功能。
由此,由于依据来自呼叫源终端的呼叫,由翻译者登录表提取可在呼叫源的语言与呼叫目标的语言之间进行翻译的翻译者的终端号码,以自动连接呼叫源终端、呼叫目标终端、及翻译者终端,并进行翻译所需的影像及声音的通信,所以可提供一种呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况的视频电话翻译服务。另外,由于翻译者只要处于可呼叫的状态,则不论其位于何处都可应用,所以可令翻译者的约束时间为最小限度而减低翻译服务的成本。
本发明第2方式的视频电话翻译系统,是如第1方式的视频电话翻译系统,其中通信机构具有对呼叫源终端发送已合成来自呼叫目标终端的影像为母画面及来自翻译者终端的影像为子画面的影像的功能;对呼叫目标终端发送已合成来自呼叫源终端的影像为母画面及来自翻译者终端的影像为子画面的影像的功能;及,对翻译者终端发送已合成来自呼叫源终端的影像与来自呼叫目标终端的影像的影像的功能。
由此,由于呼叫源与呼叫目标可通过子母画面来确认翻译者的表情,所以可轻易判读翻译者的声音,而翻译者亦可确认呼叫源的表情与呼叫目标的表情,所以可确切地翻译。
本发明第3方式的视频电话翻译系统,是如第1或2方式的视频电话翻译系统,其中通信机构具有合成来自呼叫目标终端的声音与来自翻译者终端的声音并发送至呼叫源终端的第1声音发送功能;合成来自呼叫源终端的声音与来自翻译者终端的声音并发送至呼叫目标终端的第2声音发送功能;及,合成来自呼叫源终端的声音与来自呼叫目标终端的声音并发送至翻译者终端的第3声音发送功能,另外,通信机构具有依据来自翻译者终端的指令,而抑制供给至第1声音发送功能的来自翻译者终端的声音与供给至第2声音发送功能的来自翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能,另外,第1声音发送功能具有当检测到来自翻译者终端的声音时会抑制来自呼叫目标终端的声音的呼叫目标声音抑制功能,另外,第2声音发送功能具有当检测到来自翻译者终端的声音时会抑制来自呼叫源终端的声音的呼叫源声音抑制功能。
在现有的视频会议的翻译中,是将3者声音合成的声音传送至各终端,所以在任一终端发言中,一旦其他终端亦发言,就难以掌握相互的内容。因此,实际上必须反覆进行翻译者待呼叫源发言结束再翻译,且呼叫目标等其翻译结束才发言,然后翻译者等呼叫目标发言结束再翻译的过程,实在难以进行迅速且确切的翻译。在本发明中,根据不必要侧声音抑制功能,可依据来自翻译者终端的指令,抑制向呼叫源与呼叫目标之中不必要侧发送的翻译者声音,同时通过呼叫目标声音抑制功能,当检测到翻译者的声音时可抑制向呼叫源发送的呼叫目标原语音,且通过呼叫源声音抑制功能,当检测到翻译者的声音时可抑制向呼叫目标发送的呼叫源原语音,所以可提供一种即使与翻译者的发言重复,呼叫源与呼叫目标仍可掌握翻译内容的迅速又确切的视频电话翻译服务。
此外,所谓抑制包含降低声音信号的等级以便可听取某程度的情形,以及切断以便完全无法听到的情形。另外,不必要侧声音抑制功能包含将翻译者的声音切换并发送至呼叫源与呼叫目标其中任一方的情形。
本发明第4方式的视频电话翻译系统,是如第1或2方式的视频电话翻译系统,其中通信机构具有切换来自呼叫目标终端的声音与来自翻译者终端的声音并发送至呼叫源终端的第1声音发送功能;切换来自呼叫源终端的声音与来自翻译者终端的声音并发送至呼叫目标终端的第2声音发送功能;及,合成来自呼叫源终端的声音与来自呼叫目标终端的声音并发送至翻译者终端的第3声音发送功能,另外,通信机构具有依据来自翻译者的指令,而抑制供给至第1声音发送功能的来自翻译者终端的声音与供给至第2声音发送功能的来自翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能,另外,第1声音发送功能具有当检测到来自翻译者终端的声音时会切断来自呼叫目标终端的声音并发送来自翻译者终端的声音的功能,另外,第2声音发送功能具有当检测到来自翻译者终端的声音时会切断来自呼叫源终端的声音并发送来自翻译者终端的声音的功能。
在本发明中,由于不必要侧声音抑制功能,可依据来自翻译者终端的指令,抑制向呼叫源与呼叫目标之中不必要侧发送的翻译者声音,同时第1声音发送功能在当检测到翻译者的声音时可将呼叫目标的原语音切换为翻译者的声音,且第2声音发送功能在当检测到翻译者的声音时可将呼叫源的原语音切换为翻译者的声音,所以可提供一种即使与翻译者的发言重复,呼叫源与呼叫目标仍可掌握翻译内容的迅速又确切的视频电话翻译服务。
此外,不必要侧声音抑制功能包含将翻译者的声音切换并发送至呼叫源与呼叫目标其中任一方的情形。
本发明第5方式的视频电话翻译系统,是如第1或2方式的视频电话翻译系统,其中通信机构具有将来自呼叫目标终端的声音与来自翻译者终端的声音进行声音多重合成并发送至呼叫源终端的第1声音发送功能;将来自呼叫源终端的声音与来自翻译者终端的声音进行声音多重合成并发送至呼叫目标终端的第2声音发送功能;及,将来自呼叫源终端的声音与来自呼叫目标终端的声音进行声音多重合成并发送至翻译者终端的第3声音发送功能,另外,通信机构具有依据来自翻译者终端的指令,而抑制供给至第1声音发送功能的来自翻译者终端的声音与供给至第2声音发送功能的来自翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能。
在本发明中,通过不必要侧声音抑制功能,基于来自翻译者终端的指令抑制对呼叫源和呼叫目标中的不必要侧的翻译者的声音的发送,并且在第1声音发送功能中将呼叫源的原语音和翻译者的声音进行声音的多重合成发送到呼叫源,在第2声音发送功能中对呼叫源的原语音和翻译者的声音进行声音的多重合成发送到呼叫目标,因此即使呼叫源和呼叫目标与翻译者的发言重复,自接受到的声音中选择翻译者的声音听取,提供能够把握翻译的内容且迅速确切地提供视频电话翻译系统。
另外,在不必要侧声音抑制功能中,包含将翻译者的声音切换发送至呼叫源和呼叫目标的任意一方。
本发明第6方式的视频电话翻译系统,是如第1至5方式中任一方式的视频电话翻译系统,其中通信机构具有用以记录包含来自呼叫源终端的影像、来自呼叫目标终端的影像、与来自翻译者终端的影像的影像,及包含来自呼叫源终端的声音、来自呼叫目标终端的声音、与来自翻译者终端的声音的声音的功能;及,依据来自终端的要求,播放并发送已记录的影像及声音的功能。
由此,由于可记录翻译服务中的呼叫源、呼叫目标、与翻译者的影像及声音,且依据来自终端的要求以确认记录内容,所以可对当时无法理解的事再作确认,以及事后检查翻译服务内容。
此外,影像的记录亦可是合成并记录发送至呼叫源终端的影像与发送至呼叫目标终端的影像。由此,可确认实际上呼叫源和呼叫目标所接收到的影像。
另外,声音的记录亦可是将发送至呼叫源终端的声音与发送至呼叫目标终端的声音进行声音多重合成并记录。由此,在具有声音多重分离功能的终端则可分离呼叫源的语言与呼叫目标的语言以确认内容。
另外,亦可个别地记录发送至呼叫源终端的声音与发送至呼叫目标终端的声音,且依据来自终端的指令,播放并发送所指定的侧的声音。由此,即使走不具有声音多重分离功能的终端亦可分离呼叫源的语言与呼叫目标的语言以确认内容。
本发明第7方式的视频电话翻译系统,是由将呼叫目标的语言译为呼叫源的语言的第1翻译者与将呼叫源的语言译为呼叫目标的语言的第2翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话对谈翻译系统,该视频电话翻译系统包含有用以连接呼叫源终端、呼叫目标终端、第1翻译者终端、及第2翻译者终端的连接机构;及用以进行由该连接机构连接的各终端间的影像及声音的通信的通信机构,另外,连接机构具有至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,且具有受理来自呼叫源终端的呼叫的功能;自受理其呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫源的语言种类、及呼叫目标的语言种类的功能;参照翻译者登录表由已取得的呼叫目标的语言种类与呼叫源的语言种类提取第1翻译者的终端号码的功能;通过已提取的第1翻译者的终端号码来呼叫第1翻译者终端的功能;参照翻译者登录表由已取得的呼叫源的语言种类与呼叫目标的语言种类提取第2翻译者的终端号码的功能;通过已提取的第2翻译者的终端号码来呼叫第2翻译者终端的功能;及,通过已取得的呼叫目标的终端号码来呼叫呼叫目标终端的功能,另外,通信机构具有对呼叫源终端发送包含至少来自呼叫目标终端的影像的影像与包含至少来自第1翻译者终端的声音的声音的功能;对呼叫目标终端发送包含至少来自呼叫源终端的影像的影像与包含至少来自第2翻译者终端的声音的声音的功能;对第1翻译者终端发送包含至少来自呼叫目标终端的声音的声音的功能;及,对第2翻译者终端发送包含至少来自呼叫源终端的声音的声音的功能。
由此,由于是依据来自呼叫源终端的呼叫,由翻译者登录表提取可将呼叫目标的语言译为呼叫源的语言的第1翻译者与可将呼叫源的语言译为呼叫目标的语言的第2翻译者的终端号码,以自动连接呼叫源终端、呼叫目标终端、第1翻译者终端、及第2翻译者终端,并进行翻译所需的影像及声音的通信,所以可提供一种呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况的视频电话翻译服务。另外,由于翻译者只要处于可呼叫的状态,则不论其位于何处也都可应用,所以可令翻译者的约束时间为最小限度而减低翻译服务的成本。
本发明第8方式的视频电话翻译系统,是如第7方式的视频电话翻译系统,其中通信机构具有对呼叫源终端发送已合成来自呼叫目标终端的影像为母画面及来自第1翻译者终端的影像为子画面的影像的功能;对呼叫目标终端发送已合成来自呼叫源终端的影像为母画面及来自第2翻译者终端的影像为子画面的影像的功能;对第1翻译者终端发送已合成来自呼叫目标终端的影像与来自呼叫源终端的影像的影像的功能;及,对第2翻译者终端发送已合成来自呼叫源终端的影像与来自呼叫目标终端的影像的影像的功能。
由此,由于呼叫源与呼叫目标分别地可通过子母画面来确认第1翻译者的表情与第2翻译者的表情,所以可轻易判读翻译者的声音,而各翻译者亦可确认呼叫源的表情与呼叫目标的表情,所以可确切地翻译。
本发明第9方式的视频电话翻译系统,是如第7或8方式的视频电话翻译系统,其中通信机构具有合成来自呼叫目标终端的声音与来自第1翻译者终端的声音并发送至呼叫源终端的第1声音发送功能;合成来自呼叫源终端的声音与来自第2翻译者终端的声音并发送至呼叫目标终端的第2声音发送功能;对第1翻译者终端发送至少来自呼叫目标终端的声音的第3声音发送功能;及,对第2翻译者终端发送至少来自呼叫源终端的声音的第4声音发送功能,另外,第1声音发送功能具有当检测到来自第1翻译者终端的声音时会抑制来自呼叫目标终端的声音的呼叫目标声音抑制功能,另外,第2声音发送功能具有当检测到来自第2翻译者终端的声音时会抑制来自呼叫源终端的声音的呼叫源声音抑制功能。
在本发明中,由于呼叫目标声音抑制功能,当检测到第1翻译者的声音时可抑制向呼叫源发送的呼叫目标原语音,且通过呼叫源声音抑制功能,当检测到第2翻译者的声音时可抑制向呼叫目标发送的呼叫源原语音,所以可提供一种即使与各翻译者的发言重复,呼叫源与呼叫目标仍可掌握翻译内容的迅速又确切的视频电话翻译服务。
此外,所谓抑制包含降低声音信号的等级以便可听取某程度的情形,以及切断以便完全无法听到的情形。
本发明第10方式的视频电话翻译系统,是如第7或8方式的视频电话翻译系统,其中通信机构具有切换来自呼叫目标终端的声音与来自第1翻译者终端的声音并发送至呼叫源终端的第1声音发送功能;切换来自呼叫源终端的声音与来自第2翻译者终端的声音并发送至呼叫目标终端的第2声音发送功能;对第1翻译者终端发送至少来自呼叫目标终端的声音的第3声音发送功能;及,对第2翻译者终端发送至少来自呼叫源终端的声音的第4声音发送功能,另外,第1声音发送功能具有当检测到来自第1翻译者终端的声音时会切断来自呼叫目标终端的声音并发送来自第1翻译者终端的声音的功能,另外,第2声音发送功能具有当检测到来自第2翻译者终端的声音时会切断来自呼叫源终端的声音并发送来自第2翻译者终端的声音的功能。
在本发明中,由于第1声音发送功能在当检测到第1翻译者的声音时可将呼叫目标的原语音切换为第1翻译者的声音,且第2声音发送功能在当检测到第2翻译者的声音时可将呼叫源的原语音切换为第2翻译者的声音,所以可提供一种即使与各翻译者的发言重复,、呼叫源与呼叫目标仍可掌握翻译内容的迅速又确切的视频电话翻译服务。
本发明第11方式的视频电话翻译系统,是如第7或8方式的视频电话翻译系统,其中通信机构具有将来自呼叫目标终端的声音与来自第1翻译者终端的声音进行声音多重合成并发送至呼叫源终端的第1声音发送功能;将来自呼叫源终端的声音与来自第2翻译者终端的声音进行声音多重合成并发送至呼叫目标终端的第2声音发送功能;对第1翻译者终端发送至少来自呼叫目标终端的声音的第3声音发送功能;及,对第2翻译者终端发送至少来自呼叫源终端的声音的第4声音发送功能。
在本发明中,由于第1声音发送功能会将呼叫目标的原语音与第1翻译者的声音进行声音多重合成并发送至呼叫源,且第2声音发送功能会将呼叫源的原语音与第2翻译者的声音进行声音多重合成并发送至呼叫目标,所以可提供一种即使与各翻译者的发言重复,呼叫源与呼叫目标仍可通过从已接收的声音中选择听取各翻译者的声音来掌握翻译内容的迅速又确切的视频电话翻译服务。
本发明第12方式的视频电话翻译系统,是如第7至11方式中任一方式的视频电话翻译系统,其中通信机构具有用以记录包含来自呼叫源终端的影像、来自呼叫目标终端的影像、来自第1翻译者终端的影像、与来自第2翻译者终端的影像的影像,及包含来自呼叫源终端的声音、来自呼叫目标终端的声音、来自第1翻译者终端的声音、与来自第2翻译者终端的声音的声音的功能;及,依据来自终端的要求,播放并发送已记录的影像及声音的功能。
由此,由于可记录翻译服务中的呼叫源、呼叫目标、第1翻译者、及第2翻译者的影像及声音,且依据来自终端的要求以确认记录内容,所以可对当时无法理解的事再作确认,以及事后检查翻译服务内容。
此外,影像的记录亦可是合成并记录发送至呼叫源终端的影像与发送至呼叫目标终端的影像。由此,可确认实际上呼叫源和呼叫目标所接收到的影像。
另外,声音的记录亦可是将发送至呼叫源终端的声音与发送至呼叫目标终端的声音进行声音多重合成并记录。由此,在具有声音多重分离功能的终端则可分离呼叫源的语言与呼叫目标的语言以确认内容。
另外,亦可个别地记录发送至呼叫源终端的声音与发送至呼叫目标终端的声音,且依据来自终端的指令,播放并发送所指定侧的声音。由此,即使是不具有声音多重分离功能的终端亦可分离呼叫源的语言与呼叫目标的语言以确认内容。
本发明第13方式的视频电话翻译系统,是如第1至12方式中任一方式的视频电话翻译系统,其中翻译者登录表登录有用以选择翻译者的选择信息,另外,连接机构具有自呼叫源终端取得翻译者的选择条件的功能;及,参照翻译者登录表由已取得的翻译者的选择条件提取符合的翻译者的终端号码的功能。
由此,可自翻译者登录表所登录的翻译者之中,选择适合呼叫源与呼叫目标的视频对谈目的的人。用以选择翻译者的选择信息包含有关于性别、年龄、居住地、专业领域、持有资格等的信息。
此外,若使翻译者登录表登录有翻译者的按语言区别的翻译水平,则使用者便可针对目的语言间的翻译,选择期望水平的翻译者,且翻译者可登录多种自己能对应的语言,所以可灵活又有效率地选定翻译者。
另外,在双向同时翻译的视频电话翻译系统中,通过在将翻译者登录表所登录的按语言区别的翻译水平,区分为听的水平与说的水平来登录,则可个别地选定第1翻译者的最佳人选与第2翻译者的最佳人选,且可更灵活又有效率地选定翻译者。
本发明第14方式的视频电话翻译系统,是如第1至13方式中任一方式的视频电话翻译系统,其中翻译者登录表登录有用以表示翻译者是否可受理的受理标志,另外,连接机构具有参照翻译者登录表的受理标志以提取可受理的翻译者的终端号码的功能。
由此,由于翻译者预先于翻译者登录表登录是否可受理,故可自动地选择并呼叫可受理的翻译者,所以排除无谓的呼叫,可构成更灵活又有效率的视频电话翻译系统。
本发明第15方式的视频电话翻译系统,是如第1至14方式中任一方式的视频电话翻译系统,其中连接机构具有用以产生将发送至各终端的文字信息的功能,另外,通信机构具有对各终端发送已产生的文字信息的功能。
由此,在连接呼叫源终端、呼叫目标终端、及翻译者终端时,可对各终端发送用以促使输入所需信息的文字信息。
本发明第16方式的视频电话翻译系统,是如第1至15方式中任一方式的视频电话翻译系统,其中连接机构具有用以产土将发送至各终端的声音信息的功能,另外,通信机构具有对各终端发送已产生的声音信息的功能。
由此,由于在连接呼叫源终端、呼叫目标终端、及翻译者终端时,可对呼叫源终端、呼叫目标终端、及翻译者终端发送声音信息,所以即使呼叫源终端、呼叫目标终端、及翻译者终端其中任一终端有视觉障碍者,仍可提供视频电话翻译服务。
本发明第17方式的视频电话翻译系统,是如第1至16方式中任一方式的视频电话翻译系统,其中连接机构具有依据来自各终端的指令,登录对话中所使用的用语的功能;及,依据来自各终端的指令,提取已登录的用语并产生字幕的功能,另外,通信机构具有对各终端发送已产生的字幕的功能。
由此,预先登录翻译困难的用语,则可于各终端的画面显示字幕,而可提供一种更迅速又确切的视频电话翻译服务。
本发明第18方式的视频电话翻译系统,是如第1至17方式中任一方式的视频电话翻译系统,其中翻译者登录表登录有翻译者的计费信息,另外,连接机构具有用以测量呼叫源终端或呼叫目标终端接受翻译服务的时间的功能;及,由所测量的时间与翻译者登录表所登录的计费信息来计算使用费用的功能。
由此,因翻译者登录表预先登录有翻译者的计费信息,故可对视频电话翻译服务计费适当的使用费用。
此外,亦可于翻译者登录表登录翻译者的按语言区别的翻译水平,而使用另外设计的规定翻译水平与时间单价的关系的计费表来获得计费信息。由此,可计费与翻译者的水平对应的适当使用费用。
本发明第19方式的视频电话翻译方法,是翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译方法,另外,是使用至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,另外,包含有受理来自呼叫源终端的呼叫的步骤;自受理其呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫目标的语言种类、及呼叫源的语言种类的步骤;参照翻译者登录表由已取得的呼叫源的语言种类与呼叫目标的语言种类提取翻译者的终端号码的步骤;通过已提取的翻译者的终端号码来呼叫翻译者终端的步骤;及,通过已取得的呼叫目标的终端号码来呼叫呼叫目标终端的步骤,另外,包含有对呼叫源终端发送包含至少来自呼叫目标终端的影像的影像与包含至少来自翻译者终端的声音的声音的步骤;对呼叫目标终端发送包含至少来自呼叫源终端的影像的影像与包含至少来自翻译者终端的声音的声音的步骤;及,对翻译者终端发送包含至少来自呼叫源终端的声音与来自呼叫目标终端的声音的声音的步骤。
由此,由于是依据来自呼叫源终端的呼叫,由翻译者登录表提取可在呼叫源的语言与呼叫目标的语言之间进行翻译的翻译者的终端号码,以自动连接呼叫源终端、呼叫目标终端、及翻译者终端,并进行翻译所需的影像及声音的通信,所以可提供一种呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况的视频电话翻译服务。另外,由于翻译者只要处于可呼叫的状态,则不论其位于何处也都可应用,所以可令翻译者的约束时间为最小限度而减低翻译服务的成本。
本发明第20方式的视频电话翻译方法,是由将呼叫目标的语言译为呼叫源的语言的第1翻译者与将呼叫源的语言译为呼叫目标的语言的第2翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译方法,另外,使用至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,另外,包含有受理来自呼叫源终端的呼叫的步骤;自受理其呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫目标的语言种类、及呼叫源的语言种类的步骤;参照翻译者登录表由已取得的呼叫目标的语言种类与呼叫源的语言种类提取第1翻译者的终端号码的步骤;通过已提取的第1翻译者的终端号码来呼叫第1翻译者终端的步骤;参照翻译者登录表由已取得的呼叫源的语言种类与呼叫目标的语言种类提取第2翻译者的终端号码的步骤;通过已提取的第2翻译者的终端号码来呼叫第2翻译者终端的步骤;及,通过已取得的呼叫目标的终端号码来呼叫呼叫目标终端的步骤,另外,包含有对呼叫源终端发送包含至少来自呼叫目标终端的影像的影像与包含至少来自第1翻译者终端的声音的声音的步骤;对呼叫目标终端发送包含至少来自呼叫源终端的影像的影像与包含至少来自第2翻译者终端的声音的声音的步骤;对第1翻译者终端发送包含至少来自呼叫目标终端的声音的声音的步骤;及,对第2翻译者终端发送包含至少来自呼叫源终端的声音的声音的步骤。
由此,由于是依据来自呼叫源终端的呼叫,由翻译者登录表提取可将呼叫目标的语言译为呼叫源的语言的第1翻译者与可将呼叫源的语言译为呼叫目标的语言的第2翻译者的终端号码,以自动连接呼叫源终端、呼叫目标终端、第1翻译者终端、及第2翻译者终端,并进行翻译所需的影像及声音的通信,所以可提供一种呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况的视频电话翻译服务。另外,由于翻译者只要处于可呼叫的状态,则不论其位于何处也都可应用,所以可令翻译者的约束时间为最小限度而减低翻译服务的成本。
本发明的目的、其他目的、特征及优点可由配合参照图示的以下的发明实施方式的详细说明会更加明了。


图1是本发明第一实施方式的视频电话翻译系统的系统结构图。
图2是表示本发明第一实施方式的视频电话翻译系统中显示于各终端画面的影像的例图。
图3是表示本发明第一实施方式的视频电话翻译系统中翻译者登录表的一例的图。
图4是本发明第一实施方式的视频电话翻译系统中控制装置的连接处理的处理流程图。
图5是表示促使输入呼叫源与呼叫目标的语言种类的画面的一例的图。
图6是表示促使输入翻译者选定条件的画面的一例的图。
图7是表示促使输入呼叫目标的终端号码的画面的一例的图。
图8是本发明第二实施方式的视频电话翻译系统的系统结构图。
图9是表示连接对象表的一例的图。
图10是本发明第二实施方式的视频电话翻译系统中控制装置的连接处理的处理流程图。
图11是本发明第三实施方式的视频电话翻译系统的系统结构图。
图12是表示本发明第三实施方式的视频电话翻译系统中显示于各终端画面的影像的例的图。
图13是表示本发明第三实施方式的视频电话翻译系统中翻译者登录表的一例的图。
图14是本发明第三实施方式的视频电话翻译系统中控制装置的连接处理的处理流程图。
图15是表示本发明第一实施方式的视频电话翻译系统的声音通信功能的一实施例的方块结构图。
图16是表示本发明第一实施方式的视频电话翻译系统的声音通信功能的另一实施例的方块结构图。
图17是表示本发明第三实施方式的视频电话翻译系统的声音通信功能的一实施例的方块结构图。
图18是表示本发明第三实施方式的视频电话翻译系统的声音通信功能的另一实施例的方块结构图。
图19是表示本发明第一实施方式的视频电话翻译系统的记录播放功能的实施例的方块结构图。
图20是表示本发明第三实施方式的视频电话翻译系统的记录播放功能的实施例的方块结构图。
图21是表示通过记录放功能而显示于各终端画面的影像的例的图。
图22是现有使用多点连接机构的视频会议服务以进行视频电话翻译时的系统结构。
具体实施例方式
图1表示本发明第一实施方式的视频电话翻译系统的系统结构图。本实施方式是表示呼叫源、呼叫目标、翻译者所使用的各终端为与公用电话线路连接的电话型的视频电话终端时的系统结构例。
该图中,100是设置于用以提供翻译服务的翻译中心的视频电话翻译系统,其可提供一种通过由公用电话线路40连接呼叫源使用的视频电话终端(以下称为呼叫源终端)10、呼叫目标使用的视频电话终端(以下称为呼叫目标终端)20、及翻译者使用的视频电话终端(以下称为翻译者终端)30,且翻译者通过视频电话翻译呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译服务。
呼叫源终端10、呼叫目标终端20、及翻译者终端30各自包含有用以拍摄各使用者的视频摄像机(a),用以显示已接收的影像的显示器画面(b),号码输入和信息输入用的拨号键盘(c),及用以进行声音的输入输出的头组件(d)。另外,声音的输入输出未必一定须是头载式耳机麦克风组,亦可是一般电话所用的送受话器。
这种与公用线路连接的视频电话终端有例如ITU-T建议的符合H.320的ISDN视频电话端等,不过本发明并不限于此,亦可使用使用独自的协议的视频电话终端。
此外,公用电话线路包括无线式,且视频电话终端亦可使用具有视频电话功能的便携式电话和便携式终端。
视频电话翻译系统100包含有用以连接呼叫源终端的呼叫源终端用线路接口(以下接口简称为I/F)120,用以连接呼叫目标终端的呼叫目标终端用线路I/F140,及用以连接翻译者终端的翻译者终端用线路I/F160,且该I/F分别连接有用以使影像信号、声音信号、数据信号多重化以及分离的多重、分离机构122、142、162,用以进行影像信号的压缩、解压缩的影像编码译码器124、144、164,及用以进行声音信号的压缩、解压缩的声音编码译码器126、146、166。在此,各线路I/F、各多重、分离机构、各影像编码译码器、各声音编码译码器是对应于各终端所使用的协议以进行呼叫控制、串流控制、影像信号和声音信号的压缩、解压缩。
另外,呼叫源终端用影像编码译码器124的影像输入,是连接有用以合成来自呼叫目标终端用影像编码译码器144的影像输出、来自翻译者终端用影像编码译码器164的影像输出、及呼叫源终端用字幕存储器132的输出的影像合成机构128,另外,呼叫目标终端用影像编码译码器144的影像输入,是连接有用以合成来自呼叫源终端用影像编码译码器124的影像输出、来自翻译者终端用影像编码译码器164的影像输出、及呼叫目标终端用字幕存储器152的输出的影像合成机构148。
另外,翻译者终端用影像编码译码器164的影像输入,是连接有用以合成来自呼叫源终端用影像编码译码器124的影像输出、来自呼叫目标终端用影像编码译码器144的影像输出、及翻译者终端用字幕存储器172的输出的影像合成机构168。
此外,在呼叫源终端及呼叫目标终端,是可省略翻译者的影像显示,但是由于显示翻译者的影像可使所翻译的声音的判读变得容易,所以宜事先构造为可合成翻译者的影像。
另外,在翻译者终端,可省略呼叫源和呼叫目标的影像显示,但是由于显示该影像可使翻译时声音的判读变得容易,所以宜事先构造为可合成呼叫源和呼叫目标的影像。
图2是表示在视频电话翻译系统100中,于视频对谈时显示于各终端画面的影像的例。图2(a)是呼叫源终端的画面,显示由影像合成机构128将翻译者的影像合成于呼叫目标的影像的影像。在此,是以子母画面显示呼叫目标的影像为母画面及翻译者的影像为子画面,但是亦可以子母画面显示翻译者的影像为母画面及呼叫目标的影像为子画面,亦可均等地显示两者。图2(b)是呼叫目标终端的画面,显示由影像合成机构148将翻译者的影像合成于呼叫源的影像中的影像。在此,是以子母画面显示呼叫源的影像为母画面及翻译者的影像为子画面,但是亦可以子母画面显示翻译者的影像为母画面及呼叫源的影像为子画面,亦可均等地显示两者。图2(c)是翻译者终端的画面,显示由影像合成机构168将呼叫目标的影像合成于呼叫源的影像的影像。
另一方面,呼叫源终端用声音编码译码器126的声音输入,是连接有用以合成来自呼叫目标终端用声音编码译码器146的声音输出与来自翻译者终端用声音编码译码器166的声音输出的声音合成机构130,另外,呼叫目标终端用声音编码译码器146的声音输入,是连接有用以合成来自呼叫源终端用声音编码译码器126的声音输出与来自翻译者终端用声音编码译码器166的声音输出的声音合成机构150。
另外,翻译者终端用声音编码译码器166的声音输入,是连接有用以合成来自呼叫源终端用声音编码译码器126的声音输出与来自呼叫目标终端用声音编码译码器146的声音输出的声音合成机构170。
在此,来自翻译者终端用声音编码译码器166的声音输出是输入切换器174,且依据来自翻译者终端的指令,在翻译者将呼叫目标的语言译为呼叫源的语言时供给至呼叫源终端用声音合成机构130,而在翻译者将呼叫源的语言译为呼叫目标的语言时供给至呼叫目标终端用声音合成机构150。由此,由于翻译者的声音仅发送至呼叫源与呼叫目标中任一必要的侧,所以可防止呼叫源或呼叫目标的发言被不必要的翻译者声音妨碍,使对谈流畅进行。
另外,呼叫源终端用声音合成机构130具有当检测到来自翻译者终端的声音时会抑制来自呼叫目标终端的声音音量或将来自呼叫目标终端的声音切换为来自翻译者终端的声音的功能,且呼叫目标终端用声音合成机构150具有当检测到来自翻译者终端的声音时会抑制来自呼叫源终端的声音音量或将来自呼叫源终端的声音切换为来自翻译者终端的声音的功能。由此,由于可于呼叫源和呼叫目标防止翻译者的翻译声音与对方声音重复而难以听取的情形,所以翻译者可同时翻译发言者的发言,使翻译迅速且确切。
图15是表示切换器174的翻译者声音的发送目的切换功能及声音合成机构130、150的呼叫目标声音或呼叫源声音的抑制功能的具体实施例。如图所示,来自翻译者终端用声音编码译码器166的声音输出通过由切换器174而与呼叫源终端用声音信号加法器190及呼叫目标终端用声音信号加法器193连接,依据来自PB检测器175的信号而将翻译者的声音供给至呼叫源和呼叫目标其中任一方。PB检测器175会由数据信号或音频信号检测出已按下预设在终端的拨号键盘的呼叫源选择用号码或呼叫目标选择用号码,且切换器174将来自翻译者终端的声音信号切换至所指定的侧。因此,可从拨号键盘指定翻译者翻译时其声音是对呼叫源或对呼叫目标发声。由此,翻译者的声音不会传至呼叫源与呼叫目标之中不须听翻译者声音的侧。
另一方面,呼叫源终端用声音信号加法器190通过由衰减器191连接来自呼叫目标终端用声音编码译码器146的声音输出,而当由信号检测器192检测到来自翻译者的声音时会衰减来自呼叫目标终端的声音。另外,呼叫目标终端用声音信号加法器193通过由衰减器194连接来自呼叫源终端用声音编码译码器126的声音输出,而当由信号检测器195检测到来自翻译者的声音时会衰减来自呼叫源终端的声音。在此,信号检测器192、195是设定于用以防止对方的声音因噪声等而误遭衰减的情形的适当检测等级。
此外,亦可设置适于声音信号加法器190、193的翻译者的声音输入的信号延迟器,以便呼叫源或呼叫目标可确实听取在信号检测器192、195检测到翻译者的声音随后的翻译者声音。
在所述实施例中,是通过衰减器191、194衰减声音,以便呼叫源或呼叫目标在听翻译者的声音时,可听取某程度的对方的原声,不过亦可通过切换器来完全切断。
图16是表示当翻译者的声音传送时便切断对方的声音,而仅传送翻译者的声音的情形的实施例。如图所示,使用切换器197、198以取代所述声音信号加法器190、193,且当由信号检测器192、195检测到翻译者的声音时,会切换切换器197、198由对方的声音变成翻译者的声音。其他的结构则与图15相同。
此外,此时,亦可设置适于切换器197、198的翻译者的声音输入的信号延迟器,以便呼叫源或呼叫目标可确实听取在信号检测器192、195检测到翻译者的声音随后的翻译者声音。
在所述实施例中,是说明声音信号加法器190、193单纯相加翻译者的声音与对方的声音的情形,不过亦可将两个信号进行声音多重合成。举例而言,若终端对应为立体声,则可发送已立体合成对方声音为左信号及翻译者声音为右信号的信号,且接收者在终端侧可选择必要的声音。此时,不须于视频电话翻译系统设置用以衰减对方声音的衰减器,只要接收者侧应用情况而调节头组件的左侧和右侧的音量平衡以听取声音即可。
在所述实施例中,是说明由切换器174切换将翻译者的声音发送至呼叫源或发送至呼叫目标的情形,不过亦可构造成通过由衰减器将翻译者的声音分别供给至声音信号加法器190(或切换器197)及声音信号加法器193(或切换器198),且依据PB检测器175衰减向不必要侧发送的声音信号。如此一来,通过使用衰减器,翻译者的声音亦可有某程度传送至发言者侧,所以发言者可一边确认自己的声音正被翻译一边发言。
视频电话翻译系统100包含有控制装置110,该控制装置110具有用以登录翻译者使用的翻译者用终端的终端号码的翻译者登录表112,且分别与各线路I/F120、140、160;各多重、分离机构122、142、162;各影像合成机构128、148、168;各声音合成机构130、150、170;及各字幕存储器132、152、172连接,并可提供受理来自呼叫源终端的呼叫的功能;取得呼叫源的语言种类与呼叫目标的语言种类的功能;取得翻译者的选定条件的功能;参照翻译者登录表112由所述已取得的语言种类与选定条件提取翻译者的终端号码的功能;通过所述已提取的终端号码来呼叫翻译者终端的功能;取得呼叫目标的终端号码的功能;通过所述已取得的终端号码来呼叫呼叫目标终端的功能;及,连接呼叫源终端、呼叫目标终端、及翻译者终端的功能。
另外,各影像合成机构128、148、168和各声音合成机构130、150、170的动作是由控制装置110来控制,而其具有使用者可从各终端按下拨号键盘的预定号码按钮来变更影像显示方法或声音输出方法的功能。这是可通过在各多重、分离机构122、142、162由数据信号或音频信号检测出各终端已按下拨号键盘的号码按钮,且将此情形传送至控制装置来实现。由此,各终端可应用目的而仅选择显示必要的影像和声音,以及替换母画面与子画面,变更子画面的位置等等,灵活地使用。
再者,各影像合成机构128、148、168的输入是各自连接有呼叫源终端用字幕存储器132、呼叫目标终端用字幕存储器152、翻译者终端用字幕存储器172,而各字幕存储器132、152、172的内容是可由控制装置110设定。由此,在设定通过翻译的视频电话对谈时,可于各字幕存储器132、152、172设定针对各终端的信息,且对各影像合成机构128、148、168下达选择各字幕存储器132、152、172的信号的指令,以对各终端传达必要的信息来确立3方通话。
另外,当视频电话对谈中有难以说明的用语或发音困难的语词等时,是可预先将该用语与各终端的拨号键盘的号码对应登录于控制装置110的用语登录表113,且于各多重、分离机构122、142、162由数据信号或音频信号检测出视频电话对谈中各终端的拨号键盘已按下,再由用语登录表113提取对应于已按下的拨号键盘的号码的用语来产生文字字幕,并设定于各字幕存储器,以便于各终端显示该用语。由此,由于可使用文字字幕将难以说明的用语或发音困难的语词传达给对方,所以可提供一种更迅速又确切的视频电话翻译服务。
接下来,说明用以设定通过翻译的视频电话对谈的控制装置110的连接处理。
在该处理之前,预先由适当的终端(图示省略)于控制装置110的翻译者登录表112登录翻译者的选定信息与翻译者使用的终端的终端号码。图3是表示翻译者登录表112所登录的登录项目的例。所谓翻译者的选定信息乃是用以选定使用者期望的翻译者的信息,其登录有性别、年龄、可对应的语言、居住地、专业领域等。关于可对应的语言,是按语言区别登录翻译者的水平,以便可在使用者的目的语言间选定期望的水平的翻译者。在此,翻译的水平是以1表示高级,2为中级,3为初级。关于居住地,是假定使用者期望具有关于特定地区的地理知识的人的情形,在此是可通过邮政编码来指定地区。关于专业领域,是假定当对谈内容为专业性时使用者期望具有该领域的专业知识的人或熟悉该领域话题的人的情形,在此是可将翻译者擅长的领域区分为政治、法律、商务、教育、科学技术、医疗、语言学、体育、兴趣等来登录。另外,由于专业领域涉及多方面,所以亦可分级式登录,而在选择时以使用者期望的水平来搜寻。
其他,亦可预先登录各翻译者持有的资格,再选定使用者期望的持有资格者来翻译。
关于终端号码,在此是以与公用电话线路连接的视频电话终端为对象,所以是登录终端的电话号码。
另外,翻译者登录表112设有用以显示已登录的翻译者是否可受理翻译的受理标志,而已登录的翻译者可由自己的终端呼叫翻译中心,并使用拨号键盘输入指令以设定和重设受理标志。由此,已登录的翻译者只在可受理翻译时设定翻译者登录表的受理标志以排除无谓的呼叫,使用者亦可迅速地选择可对应的翻译者。
图4是表示控制装置110的连接处理的处理流程。视频电话翻译系统100是通过由呼叫源拨打呼叫源终端用线路I/F的电话号码来受理翻译服务的申请,且呼叫翻译者终端与呼叫目标终端以确立视频电话翻译服务用的连接。
如图所示,首先检测呼叫源终端用线路I/F120是否有呼叫(S100)。若检测到呼叫,便对呼叫源终端显示促使输入呼叫源语言种类的画面(S102)。这是通过在呼叫源终端用字幕132设定例如第5(a)图所示的信息来进行。取得呼叫源针对此所输入的呼叫源语言种类(S104)。由此,之后的针对呼叫源终端及翻译者终端的信息将以已取得的呼叫源语言种类来进行。
接着,对呼叫源终端显示促使输入呼叫目标语言种类的画面(S106)。这是通过在呼叫源终端用字幕132设定例如第5(b)图所示的信息来进行。取得呼叫源针对此所输入的呼叫目标语言种类(S108)。由此,针对呼叫目标终端的信息将以已取得的呼叫目标语言种类来进行。
另外,对呼叫源终端显示促使输入翻译者的选定条件的画面(S110)。这是通过在呼叫源终端用字幕132设定例如第6(a)图所示的信息来进行。取得呼叫源针对此所输入的翻译者选定条件(S112)。在此,呼叫源输入的翻译者选定条件为性别、年龄分层、地区、专业领域、翻译的水平。另外,地区是使用邮政编码来指定,且按照从居住地接近所指定的地区开始的顺序来选定翻译者。如果不论哪一选定项目皆不必特别指定时,则可选择不限。
接着,参照翻译者登录表112,提取在呼叫源语言与呼叫目标语言上具有所指定的翻译水平,且性别、年龄、居住地、专业领域与已取得的选定条件一致并设定受理标志翻译者,再对呼叫源终端显示翻译者候选人名单以促使输入期望的翻译者的选择号码(S114)。这是通过在呼叫源终端用字幕132设定例如第6(b)图所示的信息与翻译者候选人名单来进行。此时,提取翻译者登录表112所登录的该翻译者的时间单价(图示省略),并显示为收费。由此,使用者可考虑翻译服务所需的费用来选择适当的翻译者。另外,亦可另外设置规定翻译者翻译水平与时间单价的关系的计费表,且参照该计费表而由已选定的翻译者的翻译水平来求得翻译者的时间单价。取得呼叫源针对这种翻译者候选人名单所输入的选择号码(S116),且由翻译者登录表112提取该所选择的翻译者的终端号码并呼叫的(S118)。此时,亦可使用翻译者终端用字幕172向翻译者终端通知呼叫源的个人信息、呼叫源与呼叫目标的语言种类、翻译者的选定条件等,以确认其是否受理翻译。另外,呼叫源的个人信息是例如使该翻译服务成为会员制,并只须使用业已预先登录的会员信息即可。
当该翻译者终端有回应时(S120),就对呼叫源终端显示促使输入呼叫目标的终端号码的画面(S122)。这是通过在呼叫源终端用字幕132设定例如图7所示的信息来进行。提取呼叫源针对此所输入的呼叫目标终端号码并呼叫的(S124)。此时,同样地,亦可使用呼叫目标终端用字幕152向呼叫目标终端通知呼叫源的个人信息、呼叫源与呼叫目标的语言种类、翻译者的选定条件等,以确认其是否接受呼叫或是否有设定条件的错误等。
然后,当该呼叫目标终端有回应时(S126),就可开始视频电话翻译服务(S128)。
在S120中,当所选择的翻译者终端未有回应时,则判断是否有次候选人(S130),若有次候选人,便返回S118以重复步骤,而若无次候选人,则向呼叫源终端通知该内容并切断(S132)。在S126中,当呼叫目标终端未有回应时,则向呼叫源终端及所选择的翻译者终端通知该内容并切断(S134)。
控制装置110具有用以计算翻译服务的使用费用的计时器(图示省略),其可测量连接开始直到切断为止的时间。此外,翻译服务结束后,由通过计时器测量的时间与所述时间单价来计算使用费用并登录于计费数据库114,日后再向使用者收费。
所述实施方式是构造成当所选择的翻译者终端未有回应时,仅向呼叫源终端通知该内容并切断,不过亦可设置翻译预约表并登录呼叫源终端号码与呼叫目标终端号码,且当所选择的翻译者终端有回应时,即通知呼叫源与呼叫目标以设定视频电话翻译服务。
所述实施方式是构造成为了选定翻译者而使呼叫源输入呼叫源的语言种类与呼叫目标的语言种类,不过亦可预先按每一呼叫源的语言或每一呼叫源语言与呼叫目标语言的组合来规定翻译中心的电话号码,以便取得呼叫源或呼叫目标的语言种类。另外,所述实施方式是构造成为了选定翻译者而使呼叫源输入翻译者的选定条件,不过亦可首先询问是否要指定翻译者的选定条件,当选择不指定时,就仅由已输入的语言种类来选定翻译者。
另外,亦可构造成在紧急时呼叫源首先按下特定拨号号码以自动呼叫专门对应紧急的翻译者。
所述实施方式中,是说明视频电话翻译系统100包含有线路I/P、多重、分离机构、影像编码译码器、声音编码译码器、影像合成机构、声音合成机构、控制装置等,不过所述者未必一定要由独立的H/W构成,亦可使用计算机通过软件处理来实现各装置的功能。
所述实施方式中,是说明翻译者终端30是与呼叫源终端10和呼叫目标终端20一样地位于翻译中心之外,且由翻译中心通过公用电话线路呼叫以提供翻译服务,不过本发明并不限于此,当然亦可将翻译者终端之一部份或全部设在翻译中心内而自翻译中心提供翻译服务。
此外,所述实施方式中,由于翻译者只要具有可与公用电话线路连接的终端,则不论其位于何处都可参加翻译服务,所以可使用所述受理标志而有效活用时间空档地来提供翻译服务。如此一来,可有效率又稳定地运用难以确保人员数的翻译服务。
所述实施方式中,影像合成机构128、148、168未输入有本身终端的影像信号,不过亦可设置也输入本身终端的影像信号以合成显示作为影像确认用的功能。
另外,所述实施方式中是通过影像合成机构128、148、168按各终端别合成影像,不过本发明并不限于此,亦可批次地合成所有终端的影像并发送至各终端。此时,例如图21(a)所示,亦可以4分割画面显示呼叫源的影像、呼叫目标的影像、及翻译者的影像。
另外,所述实施方式中,是设置字幕存储器132、152、172,且将所述的输出供给至对应的影像合成机构128、148、168,以发挥于各终端显示文字字幕的功能,不过亦可设置可存储声音信息的字幕存储器,且将所述的输出供给至对应的声音合成机构130、150、170,以发挥输出声音信息至各终端的功能。由此,即使呼叫源、呼叫目标、及翻译者其中任一者有视觉障碍,仍可提供视频电话翻译服务。
图8是本发明第二实施方式的视频电话翻译系统的系统结构图。在本实施方式中,呼叫源、呼叫目标、及翻译者所使用的各终端乃是与互联网连接的IP(internet protocol)型视频电话终端,且是显示其为具有Web浏览器功能时的系统结构例。
该图中,200是设置于用以提供翻译服务的翻译中心的视频电话翻译系统,其可提供一种通过由互联网80来连接呼叫源使用的呼叫源终端60、呼叫目标使用的呼叫目标终端70、及翻译者使用的翻译者终端231、232、…其中任一者,以对呼叫源与呼叫目标提供视频电话翻译服务。
呼叫源终端60、呼叫目标终端70、及翻译者终端231、232、…,在此是使用包含有具备影像输入I/F功能、声音输入输出I/F功能、网络连接功能的个人计算机等通用处理装置(a),还有信息输入用的键盘(b)及鼠标(c);用以显示由Web服务器210提供的Web页画面和由通信服务器220供给的视频电话画面的显示器(d);用以拍摄各终端使用者的影像的视频摄像机(e);及各终端使用者用以进行声音的输入输出的头组件(f),并安装有IP视频电话软件与Web浏览器的终端,不过亦可使用专用视频电话终端。
此外,与互联网连接的视频电话终端有例如ITU-T建议的符合H.323的IP视频电话端等,不过本发明并不限于此,亦可使用使用独自的协议的视频电话终端。
另外,互联网包含无线LAN式,且视频电话亦可使用为具有视频电话功能的便携式电话和便携式终端并可提供Web存取功能。
视频电话翻译系统200包含有通信服务器220,是具有用以设定欲连接的呼叫源终端、呼叫目标终端、及翻译者终端的各终端地址的连接对象表222,且具有连接连接对象表222所登录的终端间并合成自各终端接收到的影像及声音再发送至各终端的功能;Web服务器210,是具有如所述般用以登录翻译者的选定信息、终端地址、受理标志翻译者登录表212,且具有通过由呼叫源终端使用浏览器存取以选择期望的翻译者,且于通信服务器220的连接对象表222设定呼叫源终端、呼叫目标终端、及翻译者终端的各终端地址的功能;路由器250,是用以将Web服务器210及通信服务器220与互联网连接;及多个翻译者终端231、232、…、23N,是由通信服务器220与网络所连接。
图9是表示连接对象表222的一例。如图所示,连接对象表222设定有呼叫源终端的终端地址、呼叫目标终端的终端地址、翻译者终端的终端地址以便登录,由此可设定1个翻译服务。连接对象表222是可对应通信服务器220的处理能力而登录多个这种终端地址的设定,由此,可同时提供多个翻译服务。
此外,因为连接对象表222所登录的终端地址是互联网上的地址,所以一般可使用IP地址,不过并不限于此,亦可为使用由目录服务器赋与的名称等。
通信服务器220可对连接对象表222所设定的呼叫源终端、呼叫目标终端、翻译者终端进行遵循预定的协议的分组传输,且可通过软件处理来提供与所述视频电话翻译系统100的多重、分离机构122、142、162,影像编码译码器124、144、164,声音编码译码器126、146、166,影像合成机构128、148、168,及声音合成机构130、150、170同等的功能。
由此,与所述视频电话翻译系统100一样地可在呼叫源终端、呼叫目标终端、翻译者终端之间进行预定影像及声音的通信,且在呼叫源与呼叫目标之间提供通过翻译者的视频电话翻译服务。
此外,所述视频电话翻译系统100具有使用控制装置100和字幕存储器132、152、172,并依据视频电话对谈中来自终端的指令而提取登录在用语登录表113的用语,且在终端显示为文字字幕的功能,在本实施方式中,亦可通过通信服务器220的软件处理来设置同样的功能。另外,可通过Web服务器210将由各终端指定的用语对其他终端显示为弹出信息,亦可于通信服务器220设置字幕存储器,并经由Web服务器210将由各终端指定的用语写入该字幕存储器,以便于各终端显示文字字幕。
在所述的翻译中心中,是通过控制装置110实现连接呼叫源终端、呼叫目标终端、及翻译者终端的连接处理,而在本实施方式中,由于是以各终端具有存取功能的情形为对象,所以是通过Web服务器210进行连接处理。
图10是表示Web服务器210的连接处理的处理流程。本视频电话翻译系统200是通过由呼叫源终端使用Web浏览器存取登入翻译中心的Web服务器210,以开始翻译服务的受理处理。
如图所示,Web服务器210首先取得呼叫源的终端地址(S200),并在连接对象表222(S202)设定。接着,将与第5(a)图一样的促使输入呼叫源语言种类的画面发送至呼叫源终端(S204),且取得呼叫源针对此所输入的呼叫源语言种类(S206)。另外,将与第5(b)图一样的促使输入呼叫目标语言种类的画面发送至呼叫源终端(S208),且取得呼叫源针对此所输入的呼叫目标语言种类(S210)。另外,将与所述第6(a)图一样的促使输入翻译者选定条件的画面发送至呼叫源终端(S212),且取得呼叫源针对此所输入的翻译者选定条件(S214)。
其次,参照翻译者登录表212,在与已取得的语言种类和选定条件一致并设定受理标志翻译者之中,选定设定受理标志翻译者,且将与所述第6(b)图一样的符合者名单发送至呼叫源终端以促使输入期望的翻译者的选择号码(S216)。取得呼叫源针对此所输入的翻译者的选择号码,且由翻译者登录表212取得该所选择的翻译者的终端地址(S218)。依据已取得的翻译者终端地址,将呼叫画面发送至该翻译者终端(S220),且当有受理呼叫的内容的回答时(S222),就将该翻译者的终端地址设定于连接对象表222(S224)。然后,将与图7一样的促使输入呼叫目标的终端地址的画面发送至呼叫源终端(S226),且取得呼叫源针对此所输入的呼叫目标的终端地址(S228)。依据已取得的呼叫目标的终端地址,将呼叫画面发送至该呼叫目标终端(S230),且当有受理呼叫的内容的回答时(S232),就将该呼叫目标的终端地址设定于连接对象表222(S234)。由此,可开始视频电话翻译服务(S236)。
在S222中,当没有该翻译者终端受理呼叫的内容的回答时,则判断是否有次候选人(S238),若有次候选人,便将促使选择其他候选人的信息发送至呼叫源终端(S240),且返回S218,而若无次候选人,则向呼叫源终端通知该内容(S242)并结束。在S232中,当没有该呼叫目标终端受理呼叫的内容的回答时,则向呼叫源终端及所选择的翻译者终端通知该内容(S244)并结束。
所述实施方式亦是说明当没有所选择的翻译者终端受理呼叫的内容的回答时,仅向呼叫源通知该内容并结束,不过也可设置翻译预约表并登录呼叫源终端地址与呼叫目标终端地址,且当所选择的翻译者终端有回应时,即通知呼叫源与呼叫目标以设定视频电话翻译服务。
所述实施方式中,说明翻译者终端是位于翻译中心的视频电话翻译系统200内,不过本发明并不限于此,翻译者终端之一部份或全部亦可位于翻译中心外并通过由互联网连接,以通过相同的处理来对应。
所述实施方式中,区分成呼叫源、呼叫目标、翻译者所使用的视频电话终端为与公用电话线路连接的电话型视频电话终端的情形以及所使用的视频电话终端为与互联网连接的IP型视频电话终端的情形两种来说明视频电话翻译系统的结构,不过电话型视频电话终端与IP型视频电话终端可通过设置用以进行协议转换的网关以相互通信,故亦可设置与任一协议对应的视频电话翻译系统再通过由网关来和使用其他协议的视频电话终端对应。
如此一来,本视频电话翻译系统只要具有可与公用电话线路或互联网连接的终端,则不论位于何处都可接受翻译服务的提供以及提供翻译服务。翻译者终端不一定须前往翻译中心,而亦可自自宅或设有视频电话终端的设施、地点参加,且使用具有视频电话功能的便携式电话或便携式终端来提供翻译服务。
另外,若预先于翻译中心的翻译者登录表登录可翻译的人,就随时都方便提供服务。因此,从运用翻译中心的观点来看,亦不须将翻译者集合于翻译中心,所以不论时间或费用方面皆可效率佳地运用翻译中心。
所述实施方式中,是由1位翻译者进行将呼叫目标语言译为呼叫源语言及将呼叫源语言译为呼叫目标语言,不过亦可个别地设定将呼叫目标语言译为呼叫源语言的第1翻译者及将呼叫源语言译为呼叫目标语言的第2翻译者,以进行双向同时翻译。
图11是可提供双向同时翻译服务的本发明第三实施方式的视频电话翻译系统的系统结构例。在此,是显示使用电话型视频电话时的结构例,不过如前所述,使用IP电话型视频电话亦是可一样地构成。
该图中,300是设置于用以提供双向同时翻译服务的翻译中心的视频电话翻译系统,其可提供一种通过由公用电话线路40来连接呼叫源使用的视频电话终端(以下称为呼叫源终端)10、呼叫目标使用的视频电话终端(以下称为呼叫目标终端)20、第1翻译者使用的视频电话终端(以下称为第1翻译者终端)32、及第2翻译者使用的视频电话终端(以下称为第2翻译者终端)34,由第1翻译者与第2翻译者通过视频电话来双向同时翻译呼叫源和呼叫目标之间的视频电话对谈的视频电话翻译服务。
视频电话翻译系统300包含有呼叫源终端用线路I/F320,呼叫目标终端用线路I/F340,第1翻译者终端用线路I/F360,及第2翻译者终端用线路I/F380,且连接有多重、分离机构322、342、362、382,影像编码译码器324、344、364、384,及声音编码译码器326、346、366、386。在此,在此,各线路I/F、各多重、分离机构、各影像编码译码器、各声音编码译码器是对应于各终端所使用的协议以进行呼叫控制、串流控制、影像信号和声音信号的压缩、解压缩。
另外,呼叫源终端用影像编码译码器324的影像输入,是连接有用以合成来自呼叫目标终端用影像编码译码器344的影像输出、来自第1翻译者终端用影像编码译码器364的影像输出、及呼叫源终端用字幕存储器332的输出的影像合成机构328,另外,呼叫目标终端用影像编码译码器344的影像输入,是连接有用以合成来自呼叫源终端用影像编码译码器324的影像输出、来自第2翻译者终端用影像编码译码器384的影像输出、及呼叫目标终端用字幕存储器352的输出的影像合成机构348。
另外,第1翻译者终端用影像编码译码器364的影像输入,是连接有用以合成来自呼叫源终端用影像编码译码器324的影像输出、来自呼叫目标终端用影像编码译码器344的影像输出、及第1翻译者终端用字幕存储器372的输出的影像合成机构368,另外,第2翻译者终端用影像编码译码器384的影像输入,是连接有用以合成来自呼叫目标终端用影像编码译码器344的影像输出、来自呼叫源终端用影像编码译码器324的影像输出、及第2翻译者终端用字幕存储器392的输出的影像合成机构388。
此外,在呼叫源终端及呼叫目标终端,走可省略第1翻译者和第2翻译者的影像显示,但是由于显示翻译者的影像可使所翻译的声音的判读变得容易,所以宜事先构造为可合成翻译者的影像。
另外,在第1翻译者终端及第2翻译者终端,是可省略呼叫源和呼叫目标的影像显示,但是由于显示该影像可使翻译时声音的判读变得容易,所以宜事先构造为可合成呼叫源和呼叫目标的影像。
图12是表示视频电话翻译系统300在视频对谈中显示于各终端画面的影像的例。图12(a)是呼叫源终端的画面,显示由影像合成机构328将第1翻译者的影像合成于呼叫目标的影像的影像。在此,是以子母画面显示呼叫目标的影像为母画面及第1翻译者的影像为子画面,但是亦可以子母画面显示第1翻译者的影像为母画面及呼叫目标的影像为子画面,亦可均等地显示两者。图12(b)是呼叫目标终端的画面,显示由影像合成机构348将第2翻译者的影像合成于呼叫源的影像中的影像。在此,是以子母画面显示呼叫源的影像为母画面及第2翻译者的影像为子画面,但是亦可以子母画面显示第2翻译者的影像为母画面及呼叫源的影像为子画面,亦可均等地显示两者。图12(c)是第1翻译者终端的画面,显示由影像合成机构368将呼叫源终端的影像合成于呼叫目标终端的影像中的影像。在此,是以子母画面显示呼叫目标的影像为母画面及呼叫源的影像为子画面,但是亦可相反,亦可均等地显示两者。图12(d)是第2翻译者终端的画面,显示由影像合成机构388将呼叫目标终端的影像合成于呼叫源终端的影像中的影像。在此,是以子母画面显示呼叫源的影像为母画面及呼叫目标的影像为子画面,但是亦可相反,亦可均等地显示两者。
另一方面,呼叫源终端用声音编码译码器326的声音输入,是连接有用以合成来自呼叫目标终端用声音编码译码器346的声音输出与来自第1翻译者终端用声音编码译码器366的声音输出的声音合成机构330,另外,呼叫目标终端用声音编码译码器346的声音输入,是连接有用以合成来自呼叫源终端用声音编码译码器326的声音输出与来自第2翻译者终端用声音编码译码器386的声音输出的声音合成机构350。
另外,第1翻译者终端用声音编码译码器366的声音输入是连接有来自呼叫目标终端用声音编码译码器346的声音输出,另外,第2翻译者终端用声音编码译码器386的声音输入是连接有来自呼叫源终端用声音编码译码器326的声音输出。
由此,由于第1翻译者的声音仅发送至呼叫源,且第2翻译者的声音仅发送至呼叫目标,所以可防止呼叫源的发言被第2翻译者的声音妨碍,以及呼叫目标的发言被第1翻译者的声音妨碍,使对谈流畅进行。
另外,呼叫源终端用声音合成机构330具有当检测到来自第1翻译者终端的声音时会抑制来自呼叫目标终端的声音音量的功能,另外,呼叫目标终端用声音合成机构350具有当检测到来自第2翻译者终端的声音时会抑制来自呼叫源终端的声音音量的功能。由此,由于可于呼叫源和呼叫目标分别防止第1翻译者或第2翻译者的声音与对方声音重复而难以听取的情形,所以第1翻译者及第2翻译者可同时翻译发言者的发言,使翻译迅速且确切。
图17是表示声音合成机构330、350的呼叫目标声音或呼叫源声音的抑制功能的具体实施例。如图所示,来自第1翻译者终端用声音编码译码器366的声音输出是与呼叫源终端用声音信号加法器390连接,而来自第2翻译者终端用声音编码译码器386的声音输出是与呼叫目标终端用声音信号加法器393连接。因此,不必要的第2翻译者声音不会传至呼叫源,而不必要的第1翻译者声音不会传至呼叫目标。
另一方面,呼叫源终端用声音信号加法器390通过由衰减器391连接来自呼叫目标终端用声音编码译码器346的声音输出,而当由信号检测器392检测到来自第1翻译者的声音时会衰减来自呼叫目标终端的声音。另外,呼叫目标终端用声音信号加法器393通过由衰减器394连接来自呼叫源终端用声音编码译码器326的声音输出,而当由信号检测器395检测到来自第2翻译者的声音时会衰减来自呼叫源终端的声音。在此,信号检测器392、395是设定于用以防止对方的声音因噪声等而误遭衰减的情形的适当检测等级。
此外,亦可设置适于声音信号加法器390、393的翻译者的声音输入的信号延迟器,以便呼叫源或呼叫目标可确实听取在信号检测器392、395检测到翻译者的声音随后的翻译者声音。
在所述实施例中,是通过衰减器391、394衰减声音,以便呼叫源或呼叫目标在听第1翻译者或第2翻译者的声音时,可听取某程度的对方的原声,不过亦可通过切换器来完全切断。
图18是表示当翻译者的声音传送到时便切断对方的声音,而仅传送翻译者的声音的情形的实施例。如图所示,使用切换器397、398以取代所述声音信号加法器390、393,且当由信号检测器392、395检测到翻译者的声音时,将切换器397、398切换由对方的声音变成翻译者的声音。其他的结构则与图17相同。
此外,亦可设置适于切换器397、398的翻译者的声音输入的信号延迟器,以便呼叫源或呼叫目标可确实听取在信号检测器392、395检测到翻译者的声音随后的翻译者声音。
在所述实施例中,是说明声音信号加法器390、393单纯相加翻译者的声音与对方的声音的情形,不过亦可将两个信号进行声音多重合成。举例而言,若终端对应为立体声者,则可发送已立体合成对方声音为左信号及翻译者声音为右信号的信号,且接收者在终端侧可选择必要的声音。此时,不须于视频电话翻译系统设置用以衰减对方声音的衰减器,只要接收者侧应用情况而调节头组件的左侧和右侧的音量平衡以听取声音即可。
在所述实施例中,是说明第1翻译者仅听取呼叫目标的声音再翻译,且第2翻译者仅听取呼叫源的声音再翻译的情形,不过亦可衰减呼叫源声音和第2翻译者声音并相加于发送至第1翻译者的声音,或者进行声音多重合成再发送,且衰减呼叫目标声音和第1翻译者声音并相加于发送至第2翻译者的声音,或者进行声音多重合成再发送。若如此进行,各翻译者就可一边确认整体对谈进行状况和翻译对象的反应,一边进行翻译。
另外,视频电话翻译系统300包含有控制装置310,该控制装置310具有用以登录翻译者使用的翻译者用终端的终端号码的翻译者登录表312,且分别与各线路I/F320、340、360、380;各多重、分离机构322、342、362、382;各影像合成机构328、348、368、388;各声音合成机构330、350;及各字幕存储器332、352、372、392连接,并可提供受理来自呼叫源终端的呼叫的功能;取得呼叫源的语言种类与呼叫目标的语言种类的功能;取得翻译者的选定条件的功能;参照翻译者登录表312由所述已取得的语言种类与选定条件提取第1翻译者与第2翻译者的终端号码的功能;通过所述已提取的终端号码来呼叫第1翻译者终端与第2翻译者终端的功能;取得呼叫目标的终端号码的功能;通过所述已取得的终端号码来呼叫呼叫目标终端的功能;及,连接呼叫源终端、呼叫目标终端、第1翻译者终端、及第2翻译者终端的功能。
另外,各影像合成机构328、348、368、388和各声音合成机构330、350的动作是由控制装置310来控制,而其具有使用者可从各终端按下拨号键盘的预定号码按钮来变更影像显示方法或声音输出方法的功能。这是可通过在各多重、分离机构322、342、362、382由数据信号或音频信号检测出各终端已按下拨号键盘的号码按钮,且将此情形传送至控制装置来实现。由此,各终端可应用目的而仅选择显示必要的影像和声音,以及替换母画面与子画面,变更子画面的位置等等,灵活地使用。
再者,各影像合成机构328、348、368、383的输入是各自连接有呼叫源终端用字幕存储器332、呼叫目标终端用字幕存储器352、第1翻译者终端用字幕存储器372、第2翻译者终端用字幕存储器392,而各字幕存储器332、352、372、392的内容是可由控制装置310设定。由此,在设定通过翻译的视频电话对谈时,可于各字幕存储器332、352、372、392设定针对各终端的信息,且对各影像合成机构328、348、368、388下达选择各字幕存储器332、352、372、392的信号的指令,以对各终端传达必要的信息来确立4方通话。
另外,当视频电话对谈中有难以说明的用语或发音困难的语词等时,是可预先将该用语与各终端的拨号键盘的号码对应登录于控制装置310的用语登录表313,且于各多重、分离机构322、342、362、382由数据信号或音频信号检测出视频电话对谈中各终端的拨号键盘已按下,再由用语登录表313提取对应于已按下的拨号键盘的号码的用语来产生文字字幕,并设定于各字幕存储器,以便于各终端显示该用语。由此,由于可使用文字字幕将难以说明的用语或发音困难的语词传达给对方,所以可进行一种更迅速又确切的视频电话对谈。
接下来,说明用以设定双向同时翻译的视频电话对谈的控制装置310的连接处理。
此时,亦在该处理之前,预先由适当的终端(图示省略)于控制装置310的翻译者登录表312登录翻译者的选定信息与各翻译者使用的终端的终端号码。图13是表示翻译者登录表312所登录的登录项目的例。如图所示,翻译者登录表312所登录的登录项目是与图3所示的翻译者登录表112的登录项目一样,不过关于可对应的语言,将区分为听的水平与说的水平来登录。由此,可分别地选定将呼叫目标语言译为呼叫源语言的第1翻译者的最佳人选及将呼叫源语言译为呼叫目标语言的第2翻译者的最佳人选。
图14是表示控制装置310的连接处理的处理流程。视频电话翻译系统300是通过由呼叫源拨打呼叫源终端用线路I/F的电话号码来受理翻译服务的申请,且呼叫第1翻译者终端、第2翻译者终端、及呼叫目标终端以确立双向同时电话翻译服务用的连接。
如图所示,首先检测呼叫源终端用线路I/F320是否有呼叫(S300)。若检测到呼叫,便对呼叫源终端显示与第5(a)图一样的促使输入呼叫源语言种类的画面(S302),且取得呼叫源针对此所输入的呼叫源语言种类(S304)。另外,对呼叫源终端显示与第5(b)图一样的促使输入呼叫目标语言种类的画面(S306),且取得呼叫源针对此所输入的呼叫目标语言种类(S308)。然后,对呼叫源终端显示与第6(a)图一样的促使输入翻译者的选定条件的画面(S310),且取得呼叫源针对此所输入的翻译者选定条件(S312)。在此,呼叫源输入的翻译者选定条件是与所述单一翻译者的情形时一样,为性别、年龄分层、地区、专业领域、翻译的水平。另外,地区是使用邮政编码来指定,且按照从居住地接近所指定的地区者开始的顺序来选定翻译者。如果不论哪一选定项目皆不必特别指定时,则可选择不限。
接着,参照翻译者登录表312,选定在呼叫目标语言的听的水平与在呼叫源语言的说的水平上具有所指定的翻译水平,且性别、年龄、地区、专业领域与已取得的选定条件一致并设定受理标志翻译者作为第1翻译者(S314),再提取该所选定的翻译者的终端号码并呼叫的(S316)。当该第1翻译者终端有回应时(S318),就参照翻译者登录表312,选定在呼叫源语言的听的水平与在呼叫目标语言的说的水平上具有所指定的翻译水平,且性别、年龄、地区、专业领域与已取得的选定条件一致并设定受理标志翻译者作为第2翻译者(S320),再提取该所选定的翻译者的终端号码并呼叫的(S322)。
当该第2翻译者终端有回应时(S324),就对呼叫源终端显示与图7一样的促使输入呼叫目标的终端号码的画面(S326),且提取呼叫源针对此所输入的呼叫目标终端号码并呼叫的(S328)。
然后,当该呼叫目标终端有回应时(S330),就可开始双向同时翻译的视频电话翻译服务(S332)。
在S318中,当第1翻译者终端未有回应时,则判断是否有次候选人(S334),若有次候选人,便返回S314以重复步骤,而若无次候选人,则向呼叫源终端通知该内容并切断(S336)。在S324中,当第2翻译者终端未有回应时,则判断是否有次候选人(S338),若有次候选人,便返回S320以重复步骤,而若无次候选人,则向呼叫源终端及第1翻译者终端通知该内容并切断(S340)。在S330中,当呼叫目标终端未有回应时,则向呼叫源终端、第1翻译者终端、及第2翻译者终端通知该内容并切断(S342)。
此外,关于第1翻译者的选定(S314)及第2翻译者的选定(S320),所述是说明为求简单,故参照翻译者登录表312以选定符合预定条件的翻译者,不过亦可分别地与第一实施方式的情形一样地显示与第6(b)图相同的符合者名单,且令呼叫源从其中选择第1翻译者及第2翻译者。另外,此时亦可提取翻译者登录表312所登录的第1翻译者与第2翻译者的时间单价(图示省略),并显示为收费。由此,使用者可考虑翻译服务所需的费用来选择适当的翻译者。另外,亦可另外设置规定翻译者翻译水平与时间单价的关系的计费表,且参照该计费表而由已选定的翻译者的翻译水平来求得翻译者的时间单价。
控制装置310具有用以计算翻译服务的使用费用的计时器(图示省略),其可测量连接开始直到切断为止的时间。此外,翻译服务结束后,由通过计时器测量的时间与所述第1翻译者的时间单价与第2翻译者的时间单价的合计来计算使用费用并登录于计费数据库314,日后再向使用者收费。
所述实施方式是构造成当所选择的翻译者终端未有回应时,仅向呼叫源终端通知该内容并切断,不过亦可设置翻译预约表并登录呼叫源终端号码与呼叫目标终端号码,且当所选择的第1翻译者及第2翻译者双方有回应时,即通知呼叫源与呼叫目标以设定视频电话翻译。
所述实施方式中,是说明视频电话翻译系统300包含有线路I/F、多重、分离机构、影像编码译码器、声音编码译码器、影像合成机构、声音合成机构、控制装置等,不过所述者未必一定要由独立的H/W所构成,亦可使用计算机通过软件处理来实现各装置的功能。
所述实施方式中,说明第1翻译者终端32及第2翻译者终端34是与呼叫源终端10和呼叫目标终端20一样地位于翻译中心之外,且由翻译中心通过公用电话线路呼叫以提供翻译服务,不过本发明并不限于此,当然亦可将翻译者终端的一部份或全部设在翻译中心内而自翻译中心提供翻译服务。
此外,所述实施方式中,由于翻译者只要具有可与公用电话线路连接的终端,则不论其位于何处都可参加翻译服务,所以可使用所述受理标志而有效活用时间空档地来提供翻译服务。如此一来,可有效率又稳定地运用难以确保人员数的翻译服务。
所述实施方式中,影像合成机构328、348、368、388未输入有本身终端的影像信号,不过亦可设置也输入本身终端的影像信号以合成显示作为影像确认用的功能。
另外,所述实施方式中是通过影像合成机构328、348、368、388按各终端别合成影像,不过本发明并不限于此,亦可批次地合成所有终端的影像并发送至各终端。此时,例如图21(b)所示,亦可以4分割画面显示呼叫源的影像、呼叫目标的影像、第1翻译者的影像、及第2翻译者的影像。
另外,所述实施方式中,是设置字幕存储器332、352、372、392,且将所述者的输出供给至对应的影像合成机构328、348、368、388,以发挥于各终端显示文字字幕的功能,不过亦可设置可存储声音信息的字幕存储器,且将所述者的输出供给至对应的声音合成机构330、350,同时于第1翻译者终端用声音编码译码器366及第2翻译者终端用编码译码器386的输入端设声音合成机构,并供给对应所述者的字幕存储器的输出,以发挥输出声音信息至各终端的功能。由此,即使呼叫源、呼叫目标、第1翻译者、及第2翻译者其中任一者有视觉障碍者,仍可提供视频电话翻译服务。
最后,说明关于记录视频电话翻译服务中的影像及声音,且依据使用者的要求,播放并发送的记录播放功能。
图19是表示第一实施方式的视频电话翻译系统的记录播放功能的实施例。如图所示,来自呼叫源终端用影像编码译码器124的影像、来自呼叫目标终端用影像编码译码器144的影像、及来自翻译者终端用影像编码译码器164的影像,在影像合成器116合成,且传送至影像声音记录播放装置118。另外,发送至呼叫源终端的声音合成机构130的输出声音与发送至呼叫目标终端的声音合成机构150的输出声音,以前者作为左声音而后者成为右声音,在声音多重合成器117进行声音多重合成,传送至影像声音记录播放装置118。
翻译服务中的影像合成器116的输出影像与声音多重合成器117的输出声音可依据来自控制装置110的指令,自动记录于影像声音记录播放装置118,且按使用者另保存。当多重、分离机构122或142检测到在呼叫源终端或呼叫目标终端已按下预定拨号号码时,会依据来自控制装置110的指令,播放保存于影像声音记录播放装置118的影像及声音,且通过由已检出的终端的影像合成机构128或148与声音合成机构130或150发送至各终端。
由此,使用者可以例如图21(a)所示的4分割合成影像来确认翻译服务中的各终端的影像。另外,若使用者终端具有声音多重分离功能时,可由左声音的呼叫源语言及右声音的呼叫目标语言来确认翻译服务中的各终端的声音。此外,使用者亦可事后拨打至翻译中心并由终端输入存取码,以擂放保存于影像声音记录播放装置118的影像及声音来确认。
再者,记录于影像声音记录播放装置的影像的合成方法和声音的合成方法并不限于所述者,只要为使用者可确认翻译服务的内容即可。另外,若使用者终端不具有声音多重分离功能时,亦可个别地记录发送至呼叫源的声音与发送至呼叫目标的声音,再播放并发送由终端指定的声音。
另外,使用者亦可包含接受该翻译服务以外的人,在获准存取的人使用视频电话终端拨打至翻译中心并输入预定的存取码时,也播放并发送保存于影像声音记录播放装置118的影像及声音。
图20是表示第三实施方式的双向同时翻译的视频电话翻译系统的记录播放功能的实施例。如图所示,来自呼叫源影像编码译码器324的影像、来自呼叫目标影像编码译码器344的影像、来自第1翻译者影像编码译码器364的影像、及来自第2翻译者影像编码译码器384的影像,在影像合成器316合成,且传送至影像声音记录播放装置318。另外,发送至呼叫源终端的声音合成机构330的输出声音与发送至呼叫目标终端的声音合成机构350的输出声音,将前者作为左声音而后者成为右声音在声音多重合成器31了进行声音多重合成,以便传送至影像声音记录播放装置318。
翻译服务中的影像合成器316的输出影像与声音多重合成器317的输出声音可依据来自控制装置310的指令,自动记录于影像声音记录播放装置318,且按使用者另保存。当多重、分离机构322或342检测到在呼叫源终端或呼叫目标终端已按下预定拨号号码时,会依据来自控制装置310的指令,播放保存于影像声音记录播放装置318的影像及声音,且通过由已检出的终端的影像合成机构328或348与声音合成机构330或350发送至各终端。
由此,使用者可以例如图21(b)所示的4分割合成影像来确认翻译服务中的各终端的影像。另外,若使用者终端具有声音多重分离功能时,可由左声音的呼叫源语言及右声音的呼叫目标语言来确认翻译服务中的各终端的声音。此外,使用者亦可事后拨打至翻译中心并由终端输入存取码,以播放保存于影像声音记录搐放装置318的影像及声音来确认。
再者,记录于影像声音记录播放装置的影像的合成方法和声音的合成方法并不限于所述者,只要为使用者可确认翻译服务的内容即可。另外,若使用者终端不具有声音多重分离功能时,亦可个别地记录发送至呼叫源终端的声音与发送至呼叫目标终端的声音,再播放并发送由终端指定的声音。
另外,使用者亦可包含接受该翻译服务以外的人,在获准存取的人使用视频电话终端拨打至翻译中心并输入预定的存取码时,也播放并发送保存于影像声音记录播放装置318的影像及声音。
产业上可使用性如前所述,依据本发明的视频电话翻译系统或视频电话翻译方法,则可发挥呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况,且可令翻译者的约束时间为最小限度而减低翻译服务的成本的效果。
权利要求
1.一种视频电话翻译系统,是翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译系统,其特征在于,该视频电话翻译系统包含有用以连接呼叫源终端、呼叫目标终端、及翻译者终端的连接机构,及用以进行由所述连接机构连接的各终端间的影像及声音的通信的通信机构,所述连接机构具有至少登录有翻译者可翻译的语言种类与所述翻译者的终端号码的翻译者登录表,且具有受理来自呼叫源终端的呼叫的功能;自受理所述呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫源的语言种类、及呼叫目标的语言种类的功能;参照所述翻译者登录表由所述已取得的呼叫源的语言种类与呼叫目标的语言种类提取翻译者的终端号码的功能;通过所述已提取的翻译者的终端号码来呼叫翻译者终端的功能;及,通过所述已取得的呼叫目标的终端号码来呼叫呼叫目标终端的功能,另外,所述通信机构具有对所述呼叫源终端发送包含至少来自所述呼叫目标终端的影像的影像与包含至少来自所述翻译者终端的声音的声音的功能;对所述呼叫目标终端发送包含至少来自所述呼叫源终端的影像的影像与包含至少来自所述翻译者终端的声音的声音的功能;及,对所述翻译者终端发送包含至少来自所述呼叫源终端的声音与来自所述呼叫目标终端的声音的声音的功能。
2.如权利要求1所述的视频电话翻译系统,其特征在于,其中,所述通信机构具有对所述呼叫源终端发送已合成来自所述呼叫目标终端的影像为母画面及来自所述翻译者终端的影像为子画面的影像的功能;对所述呼叫目标终端发送已合成来自所述呼叫源终端的影像为母画面及来自所述翻译者终端的影像为子画面的影像的功能;及,对所述翻译者终端发送已合成来自所述呼叫源终端的影像与来自所述呼叫目标终端的影像的影像的功能。
3.如权利要求1或2所述的视频电话翻译系统,其特征在于,其中,所述通信机构具有合成来自所述呼叫目标终端的声音与来自所述翻译者终端的声音并发送至所述呼叫源终端的第1声音发送功能;合成来自所述呼叫源终端的声音与来自所述翻译者终端的声音并发送至所述呼叫目标终端的第2声音发送功能;及,合成来自所述呼叫源终端的声音与来自所述呼叫目标终端的声音并发送至所述翻译者终端的第3声音发送功能,另外,所述通信机构,具有依据来自所述翻译者终端的指令,而抑制供给至所述第1声音发送功能的来自所述翻译者终端的声音与供给至所述第2声音发送功能的来自所述翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能,另外,所述第1声音发送功能具有当检测到来自所述翻译者终端的声音时会抑制来自所述呼叫目标终端的声音的呼叫目标声音抑制功能,另外,所述第2声音发送功能具有当检测到来自所述翻译者终端的声音时会抑制来自所述呼叫源终端的声音的呼叫源声音抑制功能。
4.如权利要求1或2所述的视频电话翻译系统,其特征在于,所述通信机构具有切换来自所述呼叫目标终端的声音与来自所述翻译者终端的声音并发送至所述呼叫源终端的第1声音发送功能;切换来自所述呼叫源终端的声音与来自所述翻译者终端的声音并发送至所述呼叫目标终端的第2声音发送功能;及,合成来自所述呼叫源终端的声音与来自所述呼叫目标终端的声音并发送至所述翻译者终端的第3声音发送功能,另外,所述通信机构具有依据来自所述翻译者的指令,而抑制供给至所述第1声音发送功能的来自所述翻译者终端的声音与供给至所述第2声音发送功能的来自所述翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能,另外,所述第1声音发送功能具有当检测到来自所述翻译者终端的声音时会切断来自所述呼叫目标终端的声音并发送来自所述翻译者终端的声音的功能,另外,所述第2声音发送功能具有当检测到来自所述翻译者终端的声音时会切断来自所述呼叫源终端的声音并发送来自所述翻译者终端的声音的功能。
5.如权利要求1或2所述的视频电话翻译系统,其特征在于,所述通信机构具有将来自所述呼叫目标终端的声音与来自所述翻译者终端的声音进行声音多重合成并发送至所述呼叫源终端的第1声音发送功能;将来自所述呼叫源终端的声音与来自所述翻译者终端的声音进行声音多重合成并发送至所述呼叫目标终端的第2声音发送功能;及,将来自所述呼叫源终端的声音与来自所述呼叫目标终端的声音进行声音多重合成并发送至所述翻译者终端的第3声音发送功能,另外,所述通信机构具有依据来自所述翻译者终端的指令,而抑制供给至所述第1声音发送功能的来自所述翻译者终端的声音与供给至所述第2声音发送功能的来自所述翻译者终端的声音中任一不必要侧的声音的不必要侧声音抑制功能。
6.如权利要求1~5中的任一项所述的视频电话翻译系统,其特征在于,所述通信机构具有用以记录包含来自所述呼叫源终端的影像、来自所述呼叫目标终端的影像、与来自所述翻译者终端的影像的影像,及包含来自所述呼叫源终端的声音、来自所述呼叫目标终端的声音、与来自所述翻译者终端的声音的声音的功能;及,依据来自终端的要求,播放并发送所述已记录的影像及声音的功能。
7.一种视频电话翻译系统,是由将呼叫目标的语言译为呼叫源的语言的第1翻译者与将呼叫源的语言译为呼叫目标的语言的第2翻译者翻译使用不同语言的所述呼叫源与所述呼叫目标之间的视频电话对谈的视频电话翻译系统,其特征在于,该视频电话翻译系统包含有用以连接呼叫源终端、呼叫目标终端、第1翻译者终端、及第2翻译者终端的连接机构;及用以进行由所述连接机构连接的各终端间的影像及声音的通信的通信机构,另外,所述连接机构具有至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,且具有受理来自呼叫源终端的呼叫的功能;自受理所述呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫源的语言种类、及呼叫目标的语言种类的功能;参照所述翻译者登录表由所述已取得的呼叫目标的语言种类与呼叫源的语言种类提取第1翻译者的终端号码的功能;通过所述已提取的第1翻译者的终端号码来呼叫第1翻译者终端的功能;参照所述翻译者登录表由所述已取得的呼叫源的语言种类与呼叫目标的语言种类提取第2翻译者的终端号码的功能;通过所述已提取的第2翻译者的终端号码来呼叫第2翻译者终端的功能;及,通过所述已取得的所述呼叫目标的终端号码来呼叫呼叫目标终端的功能,另外,所述通信机构具有对所述呼叫源终端发送包含至少来自所述呼叫目标终端的影像的影像与包含至少来自所述第1翻译者终端的声音的声音的功能;对所述呼叫目标终端发送包含至少来自所述呼叫源终端的影像的影像与包含至少来自所述第2翻译者终端的声音的声音的功能;对所述第1翻译者终端发送包含至少来自所述呼叫目标终端的声音的声音的功能;及,对所述第2翻译者终端发送包含至少来自所述呼叫源终端的声音的声音的功能。
8.如权利要求7所述的视频电话翻译系统,其特征在于,所述通信机构具有对所述呼叫源终端发送已合成来自所述呼叫目标终端的影像为母画面及来自所述第1翻译者终端的影像为子画面的影像的功能;对所述呼叫目标终端发送已合成来自所述呼叫源终端的影像为母画面及来自所述第2翻译者终端的影像为子画面的影像的功能;对所述第1翻译者终端发送已合成来自所述呼叫目标终端的影像与来自所述呼叫源终端的影像的影像的功能;及,对所述第2翻译者终端发送已合成来自所述呼叫源终端的影像与来自所述呼叫目标终端的影像的影像的功能。
9.如权利要求7或8所述的视频电话翻译系统,其特征在于,所述通信机构具有合成来自所述呼叫目标终端的声音与来自所述第1翻译者终端的声音并发送至所述呼叫源终端的第1声音发送功能;合成来自所述呼叫源终端的声音与来自所述第2翻译者终端的声音并发送至所述呼叫目标终端的第2声音发送功能对所述第1翻译者终端发送至少来自所述呼叫目标终端的声音的第3声音发送功能;及,对所述第2翻译者终端发送至少来自所述呼叫源终端的声音的第4声音发送功能,另外,所述第1声音发送功能具有当检测到来自所述第1翻译者终端的声音时会抑制来自所述呼叫目标终端的声音的呼叫目标声音抑制功能,另外,所述第2声音发送功能具有当检测到来自所述第2翻译者终端的声音时会抑制来自所述呼叫源终端的声音的呼叫源声音抑制功能。
10.如权利要求7或8所述的视频电话翻译系统,其特征在于,所述通信机构具有切换来自所述呼叫目标终端的声音与来自所述第1翻译者终端的声音并发送至所述呼叫源终端的第1声音发送功能;切换来自所述呼叫源终端的声音与来自所述第2翻译者终端的声音并发送至所述呼叫目标终端的第2声音发送功能;对所述第1翻译者终端发送至少来自所述呼叫目标终端的声音的第3声音发送功能;及,对所述第2翻译者终端发送至少来自所述呼叫源终端的声音的第4声音发送功能,另外,所述第1声音发送功能具有当检测到来自所述第1翻译者终端的声音时会切断来自所述呼叫目标终端的声音并发送来自所述第1翻译者终端的声音的功能,另外,所述第2声音发送功能具有当检测到来自所述第2翻译者终端的声音时会切断来自所述呼叫源终端的声音并发送来自所述第2翻译者终端的声音的功能。
11.如权利要求7或8所述的视频电话翻译系统,其特征在于,所述通信机构具有将来自所述呼叫目标终端的声音与来自所述第1翻译者终端的声音进行声音多重合成并发送至所述呼叫源终端的第1声音发送功能;将来自所述呼叫源终端的声音与来自所述第2翻译者终端的声音进行声音多重合成并发送至所述呼叫目标终端的第2声音发送功能;对所述第1翻译者终端发送至少来自所述呼叫目标终端的声音的第3声音发送功能;及,对所述第2翻译者终端发送至少来自所述呼叫源终端的声音的第4声音发送功能。
12.如权利要求7~11中的任一项所述的视频电话翻译系统,其特征在于,所述通信机构具有用以记录包含来自所述呼叫源终端的影像、来自所述呼叫目标终端的影像来自所述第1翻译者终端的影像、与来自所述第2翻译者终端的影像的影像,及包含来自所述呼叫源终端的声音、来自所述呼叫目标终端的声音、来自所述第1翻译者终端的声音、与来自所述第2翻译者终端的声音的声音的功能;及,依据来自所述终端的要求,播放并发送所述已记录的影像;及声音的功能。
13.如权利要求1~12中的任一项所述的视频电话翻译系统,其特征在于,所述翻译者登录表登录有用以选择翻译者的选择信息,所述连接机构具有自所述呼叫源终端取得所述翻译者的选择条件的功能;及,参照所述翻译者登录表由所述已取得的所述翻译者的选择条件提取符合的翻译者的终端号码的功能。
14.如权利要求1~13中任一项所述的视频电话翻译系统,其特征在于,所述翻译者登录表登录有用以表示所述翻译者是否可受理的受理标志,另外,所述连接机构具有参照所述翻译者登录表的所述受理标志以提取可受理的翻译者的终端号码的功能。
15.如权利要求1~14中的任一项所述的视频电话翻译系统,其特征在于,所述连接机构具有用以产生将发送至所述各终端的文字信息的功能,另外,所述通信机构具有对所述各终端发送所述已产生的文字信息的功能。
16.如权利要求1~15中的任一项所述的视频电话翻译系统,其特征在于,所述连接机构具有用以产生对所述各终端发送的声音信息的功能,所述通信机构具有对所述各终端发送所述已产生的声音信息的功能。
17.如权利要求1~16中的任一项所述的视频电话翻译系统,其特征在于,所述连接机构具有依据来自所述各终端的指令,登录对话中所使用的用语的功能;及,依据来自所述各终端的指令,提取所述已登录的用语并产生字幕的功能,所述通信机构具有对所述各终端发送所述已产生的字幕的功能。
18.如权利要求1~17中的任一项所述的视频电话翻译系统,其特征在于,所述翻译者登录表登录有所述翻译者的计费信息,所述连接机构具有用以测量所述呼叫源终端或所述呼叫目标终端接受翻译服务的时间的功能;及,由所述所测量的时间与所述翻译者登录表所登录的计费信息来计算使用费用的功能。
19.一种视频电话翻译方法,是翻译者翻译使用不同语言的呼叫源与呼叫目标之间的视频电话对谈的视频电话翻译方法,其特征在于,使用至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,包含有受理来自所述呼叫源终端的呼叫的步骤;自受理所述呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫目标的语言种类、及呼叫源的语言种类的步骤;参照所述翻译者登录表由所述已取得的呼叫源的语言种类与呼叫目标的语言种类提取翻译者的终端号码的步骤;通过所述已提取的翻译者的终端号码来呼叫翻译者终端的步骤;及,通过所述已取得的呼叫目标的终端号码来呼叫呼叫目标终端的步骤,包含有对所述呼叫源终端发送包含至少来自所述呼叫目标终端的影像的影像与包含至少来自所述翻译者终端的声音的声音的步骤;对所述呼叫目标终端发送包含至少来自所述呼叫源终端的影像的影像与包含至少来自所述翻译者终端的声音的声音的步骤;及,对所述翻译者终端发送包含至少来自所述呼叫源终端的声音与来自所述呼叫目标终端的声音的声音的步骤。
20.一种视频电话翻译方法,是由将呼叫目标的语言译为呼叫源的语言的第1翻译者与将呼叫源的语言译为呼叫目标的语言的第2翻译者翻译使用不同语言的所述呼叫源与所述呼叫目标之间的视频电话对谈的视频电话翻译方法,其特征在于,使用至少登录有翻译者可翻译的语言种类与翻译者的终端号码的翻译者登录表,另外,包含有受理来自呼叫源终端的呼叫的步骤;自受理所述呼叫的呼叫源终端取得呼叫目标的终端号码、呼叫目标的语言种类、及呼叫源的语言种类的步骤;参照所述翻译者登录表由所述已取得的所述呼叫目标的语言种类与呼叫源的语言种类提取第1翻译者的终端号码的步骤;通过所述已提取的第1翻译者的终端号码来呼叫第1翻译者终端的步骤;参照所述翻译者登录表由所述已取得的呼叫源的语言种类与呼叫目标的语言种类提取第2翻译者的终端号码的步骤;通过所述已提取的第2翻译者的终端号码来呼叫第2翻译者终端的步骤;及,通过所述已取得的呼叫目标的终端号码来呼叫呼叫目标终端的步骤,另外,包含有对所述呼叫源终端发送包含至少来自所述呼叫目标终端的影像的影像与包含至少来自所述第1翻译者终端的声音的声音的步骤;对所述呼叫目标终端发送包含至少来自所述呼叫源终端的影像的影像与包含至少来自所述第2翻译者终端的声音的声音的步骤;对所述第1翻译者终端发送包含至少来自所述呼叫目标终端的声音的声音的步骤;及,对所述第2翻译者终端发送包含至少来自所述呼叫目标终端的声音的声音的步骤。
全文摘要
本发明可提供一种呼叫源不须事前搜寻翻译者以与呼叫目标协议也可应用紧急状况,且可令翻译者的约束时间为最小限度而减低翻译服务的成本的视频电话翻译系统及视频电话翻译方法。视频电话翻译系统(100)是通过控制装置(100)受理来自呼叫源终端(10)的呼叫,且参照翻译者登录表(112)以提取可翻译呼叫源的语言与呼叫目标的语言的翻译者的终端号码,并连接呼叫源终端(10)、呼叫目标终端(20)、及翻译者终端(30)。另外,由于具有可在各终端间进行翻译所需的影像及声音的通信的功能,且可通过切换器(174)将翻译者的声音发送至呼叫源或呼叫目标其中任一由翻译者终端的指定侧,并在检测到翻译者的声音时声音合成机构(130、150)会抑制或切断对谈对象的声音,所以可提供迅速又确切的翻译服务。
文档编号H04M3/51GK1685698SQ0382315
公开日2005年10月19日 申请日期2003年9月25日 优先权日2002年9月27日
发明者猿桥望 申请人:银河网路股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1