乘客间对话装置和乘客间对话方法与流程

文档序号:21734928发布日期:2020-08-05 01:31阅读:226来源:国知局
乘客间对话装置和乘客间对话方法与流程

本发明涉及在车厢内使乘客彼此进行对话的乘客间对话装置及乘客间对话方法。



背景技术:

在车厢内,有着由于存在导航引导语音、电影重放声音、电视重放声音、以及音乐重放声音等背景声音、因而难以听取乘客彼此的对话这样的问题。为了解决这一问题,提出了用麦克风来采集驾驶员的说话语音、并且从扬声器向后部座位的乘客输出的icc(incarcommunication:车内通信)系统。

作为控制对话者的说话语音的现有技术,例如,存在有在专利文献1中记载的电视会议系统的语音控制技术。在上述电视会议系统中,在会议终端的监视器上显示有多个会议参加者的脸部排列而成的合成视频,从会议终端的扬声器输出多个会议参加者的语音相组合而成的合成语音。在某一会议参加者进行将特定的会议参加者的脸部图像放大的操作时,该特定的会议参加者所说话的语音的音量根据脸部图像的尺寸而变大。

现有技术文献

专利文献

专利文献1:日本专利特开2008-67203号公报



技术实现要素:

发明所要解决的技术问题

在专利文献1所涉及的电视会议系统中,虽然每个会议终端存在稍许的音量的差,但重叠对象声音仅为人的声音,因此,变为控制多个大致相同的音量的语音这一情况。因此,在上述电视会议系统中,仅通过单纯地增大特定的会议参加者的说话语音的音量,从而能够使得容易地听取该说话语音。

与此相对,在车厢内,与说话语音相重叠的背景声音遍及导航引导语音、电影重放声音、电视重放声音、以及音乐重放声音等多种,并且音量也是多样的。因此,存在如下问题:存在有icc系统仅通过如上述电视会议系统那样地单纯地增大从扬声器输出的说话语音的音量、难以使得清楚地听取该说话语音这样的情形。例如,后部座位的乘客在以大音量来收视电影的爆炸场景或战斗场景时,即使icc系统将驾驶员的说话语音的音量设为最大,后部座位的乘客也很有可能无法听取到该说话语音。在该情况下,后部座位的乘客需要停止收视中的av重放或使av重放声音静音,从而无法继续收视。

本发明是为了解决上述问题而完成的,其目的在于使在车厢内乘客彼此的对话变顺利。

解决技术问题所采用的技术方案

本发明所涉及的乘客间对话装置包括:显示部,该显示部向第2乘客显示对第1乘客进行拍摄而得到的第1乘客视频;操作信息获取部,该操作信息获取部获取对显示于显示部的第1乘客视频的大小进行变更的操作信息;视频控制部,该视频控制部基于由操作信息获取部所获取到的操作信息,来变更显示于显示部的第1乘客视频的大小;语音控制部,该语音控制部在生成将第1乘客的说话语音与av源的重放声音相组合而成的合成语音时,基于在显示于显示部的第1乘客视频的大小,来控制第1乘客的说话语音与av源的重放声音之间的音量比率;以及语音输出部,该语音输出部向第2乘客输出由语音控制部所生成的合成语音。

发明效果

根据本发明,由于设为基于显示于显示部的第1乘客视频的大小,来控制第1乘客的说话语音与av源的重放声音之间的音量比率,因而可以使在车厢内乘客彼此的对话变顺利。

附图说明

图1是表示实施方式1所涉及的乘客间对话装置的概要的概念图。

图2是表示实施方式1所涉及的乘客间对话装置的结构例的框图。

图3a、图3b和图3c是表示实施方式1中的后置显示器的画面比率与后置扬声器的音量比率之间的对应关系的图。

图4是说明实施方式1中的音量比率的控制方法例的图。

图5是说明实施方式1中的音量比率的控制方法例的流程图。

图6是示出实施方式1中的音量设定曲线的一个示例的曲线图。

图7是表示实施方式2所涉及的乘客间对话装置的概要的概念图。

图8是表示实施方式2所涉及的乘客间对话装置的结构例的框图。

图9a和图9b是表示各实施方式所涉及的乘客间对话装置中的主单元的硬件结构例的图。

具体实施方式

以下,为了更详细地说明本发明,根据附图来对用于实施本发明的方式进行说明。

实施方式1.

图1是表示实施方式1所涉及的乘客间对话装置1的概要的概念图。实施方式1所涉及的乘客间对话装置1是使驾驶座的乘客(以下,称为驾驶员d。)与后部座位的乘客(以下,称为后部乘客r。)之间的对话变顺利的装置,此外,允许后部乘客r通过直观操作来进行想听取的语音的音量调整。驾驶员d相当于第1乘客,后部乘客r相当于第2乘客。

乘客间对话装置1包括:被设置在驾驶座周边的驾驶员用麦克风2和驾驶员用摄像头3、被设置在后部座位周边的后置显示器4和后置扬声器5、以及被设置在车厢内的主单元6。驾驶员用麦克风2采集驾驶员d的说话语音,并输出到主单元6。驾驶员用摄像头3拍摄驾驶员d的脸部,并作为驾驶员视频输出到主单元6。后置显示器4经由主单元6来接收将由驾驶员用摄像头3所拍摄的驾驶员视频和av源7的重放视频进行合成而得到的合成视频,并向后部乘客r显示。后置显示器4相当于显示部。后置扬声器5经由主单元6来接收将由驾驶员用麦克风2所采集到的驾驶员d的说话语音和av源7的重放声音进行合成而得到的合成语音,并向后部乘客r进行语音输出。后置扬声器5相当于语音输出部。主单元6基于显示在后置显示器4上的驾驶员视频的大小,来控制驾驶员d的说话语音与av源7的重放声音之间的音量比率。

在图1的结构中,后部乘客r从后置扬声器5听取向前说话的驾驶员d的说话语音。此外,后部乘客r由于朝向驾驶员d的方向说话,因而驾驶员d直接听取后部乘客r的说话语音。因此,能进行驾驶员d与后部乘客r之间的对话。

图2是表示实施方式1所涉及的乘客间对话装置1的结构例的框图。在图2中,实线箭头表示语音信息或视频信息的流向,虚线箭头表示操作信息的流向。

驾驶员用输入装置8接收驾驶员d的操作,并且将表示操作内容的操作信息输入到主单元6的操作信息获取部11。驾驶员用输入装置8是被设置于方向盘的远程控制开关、语音识别装置、与后文叙述的实施方式2中的前置显示器24一体的触摸面板、或被设置于前置显示器24周围的硬件开关等。

后部乘客用输入装置9接收后部乘客r的操作,并将表示操作内容的操作信息输入到主单元6的操作信息获取部11。后部乘客用输入装置9为与后置显示器4一体的触摸面板、被设置在后置显示器4周围的硬件开关、或语音识别装置等。

主单元6包括操作信息获取部11、av源选择部12、视频控制部13、和语音控制部14。

操作信息获取部11获取被输入至驾驶员用输入装置8的基于驾驶员d的操作信息、或被输入至后部乘客用输入装置9的基于后部乘客r的操作信息,并且将其输出到av源选择部12、视频控制部13、或语音控制部14。

av源选择部12从操作信息获取部11接收由后部乘客r进行的av源选择的操作信息。av源选择部12基于所接收到的操作信息来选择av源7,将所选择的av源7的视频信息输出至视频控制部13,并将语音信息输出至语音控制部14。av源7例如是导航装置、移动电话或智能手机、cd(compactdisc:高密度磁盘)、dvd(digitalversatiledisc:数字多功能光盘)或bd(blu-raydisc:蓝光光盘;注册商标)等盘重放装置、通过bluetooth(注册商标)或wifi等从而与主单元6无线连接的存储介质、或sd卡、usb(universalserialbus:通用串行总线)存储器或被内置于主单元6的存储器等存储介质。av源7不限于上述示例,也可以是电视广播、无线电广播或流媒体发布等。例如,在后部乘客r通过对后部乘客用输入装置9进行操作从而选择导航装置作为av源7的情况下,av源选择部12将来自导航装置的地图画面输出到视频控制部13,并且将导航引导语音输出到语音控制部14。此外,例如,在后部乘客r通过对后部乘客用输入装置9进行操作从而选择dvd作为av源7的情况下,av源选择部12将来自盘装置的dvd重放视频输出到视频控制部13,并且将dvd重放声音输出到语音控制部14。

视频控制部13从驾驶员用摄像头3接收驾驶员视频,从av源选择部12接收av源7的重放视频。此外,视频控制部13从操作信息获取部11接收由驾驶员d或后部乘客r所进行的对话开始的操作信息、以及由后部乘客r所进行的驾驶员视频的大小变更的操作信息。通常,视频控制部13使从av源选择部12接收到的av源7的重放视频显示于后置显示器4。另一方面,视频控制部13在接收到对话开始的操作信息时,使将驾驶员视频与av源7的重放视频相重叠而得到的合成视频(即所谓的画中画)显示于后置显示器4。另外,视频控制部13在接收到驾驶员视频的大小变更的操作信息时,根据操作信息来变更驾驶员视频相对于av源7的重放视频的大小,并且使变更后的合成视频显示于后置显示器4。

语音控制部14从驾驶员用麦克风2接收驾驶员d的说话语音,从av源选择部12接收av源7的重放声音。此外,语音控制部14从操作信息获取部11接收由驾驶员d或后部乘客r所进行的对话开始的操作信息、和由后部乘客r所进行的驾驶员视频的大小变更的操作信息。通常,语音控制部14使从av源选择部12接收到的av源7的重放声音向后置扬声器5进行语音输出。另一方面,语音控制部14在接收到对话开始的操作信息时,使将驾驶员d的说话语音与av源7的重放声音相组合而成的合成语音向后置扬声器5进行语音输出。另外,语音控制部14在接收到驾驶员视频的大小变更的操作信息时,控制驾驶员d的说话语音与av源7的重放声音之间的音量比率以使得与基于操作信息的驾驶员视频与av源7的重放视频之间的画面比率相对应,并使控制后的合成语音向后置扬声器5进行语音输出。

图3a、图3b和图3c是说明实施方式1中的后置显示器4的画面比率与后置扬声器5的音量比率之间的对应关系的图。在该示例中,在后置显示器4的画面整体上显示有av源7的重放视频,在后置显示器4的画面右下显示有驾驶员视频。驾驶员视频以右下角为基准,在对角方向上被放大或缩小。将av源7的重放视频中除了驾驶员视频以外的区域的画面横向的长度与驾驶员视频的画面横向的长度之间的比率使用作为画面比率。另外,虽然根据av源7的种类,可能存在没有重放视频的情况,但由于av源7的重放视频被显示在后置显示器4的画面整体上,因此也可以使用后置显示器4的画面的大小来取代重放视频的大小。

在图3a的示例中,av源7的重放视频与驾驶员视频之间的画面比率为0.5:0.5。在该情况下,语音控制部14将av源7的重放声音与驾驶员d的说话语音之间的音量比率控制成0.5:0.5。

在图3b的示例中,av源7的重放视频与驾驶员视频之间的画面比率为0.2:0.8。在该情况下,语音控制部14将av源7的重放声音与驾驶员d的说话语音之间的音量比率控制成0.2:0.8。

在图3c的示例中,av源7的重放视频与驾驶员视频之间的画面比率为0.7:0.3。在该情况下,语音控制部14将av源7的重放声音与驾驶员d的说话语音之间的音量比率控制成0.7:0.3。

如此,对应于从0.0:1.0变化至1.0:0.0的画面比率,语音控制部14使音量比率从0.0:1.0变化到1.0:0.0。后部乘客r通过进行对驾驶员视频的放大或缩小这样的视觉上的操作,来实现对想听取的语音的强调。

接着,说明音量比率的控制方法的一个示例。

图4是说明实施方式1中的音量比率的控制方法例的图。在该示例中,语音控制部14通过优先变更驾驶员d的说话语音的音量,来控制av源7的重放声音与驾驶员d的说话语音之间的音量比率。

在图4中,当由驾驶员d或后部乘客r进行对话开始的操作时,视频控制部13使初始状态的画面比率0.5:0.5的合成视频显示在后置显示器4。语音控制部14使得在对话开始后的初始状态下的av源7的重放声音的音量与在对话开始前由后部乘客r所设定的音量相同。即,以av源7的重放声音的音量在对话开始前后不发生变化为前提。或者,在针对语音控制部14事先设定初始音量的情况下,语音控制部14在对话开始后的初始状态下将av源7的重放声音的音量设为该初始音量。语音控制部14将驾驶员d的说话语音的音量设为与av源7的重放声音的音量相对应的音量。即,在对话开始前的av源7的重放声音的音量相对较小的情况下(a-1),在对话开始时,驾驶员d的说话语音的音量同样地变为相对较小的音量。另一方面,在对话开始前的av源7的重放声音的音量相对较大的情况下(a-2),在对话开始时,驾驶员d的说话语音的音量同样地变为相对较大的音量。

当由后部乘客r进行驾驶员视频的放大操作时,视频控制部13使画面比率0.2:0.8的合成视频显示在后置显示器4。语音控制部14通过增大驾驶员d的说话语音的音量,使音量比率为0.2:0.8(b-1)。但是,针对驾驶员d的说话语音的音量,预先确定上限。在因根据放大操作而增大驾驶员d的说话语音的音量导致说话语音的音量变成上限以上时,语音控制部14在将说话语音的音量增大到上限为止的同时,减小av源7的重放声音的音量,由此使音量比率为0.2:0.8(b-2)。通过对驾驶员d的说话语音的音量设置上限,来防止因后部乘客r所进行的驾驶员视频的急剧放大操作而造成从后置扬声器5语音输出大音量的说话语音这一情况。

当由后部乘客r进行驾驶员视频的缩小操作时,视频控制部13使画面比率0.7:0.3的合成视频显示在后置显示器4。语音控制部14通过减小驾驶员d的说话语音的音量,使音量比率为0.7:0.3(c-1)。另外,在驾驶员d的说话语音的音量达到上限的状态下进行缩小操作时(c-2),语音控制部14在将av源7的重放声音的音量返回至在对话开始前由后部乘客r所设定的音量或事先设定的初始音量之后,通过减小驾驶员d的说话语音的音量,从而使音量比率为0.7:0.3。

图5是说明实施方式1中的音量比率的控制方法例的流程图。在图5的流程图中,与图4相同,语音控制部14通过优先变更驾驶员d的说话语音的音量,来控制av源7的重放声音与驾驶员d的说话语音之间的音量比率。乘客间对话装置1在由驾驶员d或后部乘客r来进行对话开始的操作时,开始图5的流程图所示的动作。

图6是示出实施方式1中的音量设定曲线的一个示例的曲线图。曲线图的横轴为由后部乘客r的操作所设定的音量,曲线图的纵轴为语音控制部14从后置扬声器5语音输出的音量。以下,将av源7的重放声音的音量设为“b”,将驾驶员d的说话语音的音量设为“f”。如图6那样的音量b和音量f的音量设定曲线的信息由语音控制部14来预先设定。另外,如上述那样,针对驾驶员d的说话语音的音量f,确定上限f(limit)。在该示例中,后部乘客r能够在从0阶(step)到30阶之间对音量进行操作。例如,在后部乘客r进行将av源7的重放声音的音量b设定为10阶的操作的情况下,语音控制部14基于音量b的音量设定曲线,来将av源7的重放声音的音量b控制为“7”,并且向后置扬声器5进行语音输出。

在由驾驶员d或后部乘客r进行对话开始的操作时,在图5的步骤st1中,语音控制部14将av源7的重放声音的音量b设定为初始音量b(1st)。初始音量b(1st)为在对话开始前由后部乘客r所设定的音量,例如为与图6的10阶相对应的“7”。

在步骤st2中,语音控制部14将驾驶员d的说话语音的音量f设定为由av源7的重放声音的初始音量b(1st)所唯一决定的音量f(b1st)。例如,当av源7的重放声音的初始音量b(1st)为与10阶相对应的“7”时,音量f(b1st)为与相同的10阶相对应的“6”。

在步骤st3中,视频控制部13使将av源7的重放视频与驾驶员视频进行合成而得到的合成视频显示于后置显示器4。这里,在对话开始时的初始状态下,将驾驶员视频的画面横向的长度相对于后置显示器4的画面横向的长度的比率wd设为“0.5”。即,在该示例中,初始状态下的av源7的重放视频与驾驶员视频之间的画面比率为0.5:0.5。该比率wd的初始值并不限于“0.5”,也可为任意的值。

在步骤st4中,语音控制部14使得将av源7的重放声音控制为初始音量b(1st)、并且将驾驶员d的说话语音控制为音量f(b1st)的合成语音向后置扬声器5进行语音输出。在该示例中,初始状态的画面比率被设定成0.5:0.5,因此,语音控制部14将b(1st):f(b1st)=7:6视为与画面比率0.5:0.5对应的音量比率0.5=0.5。

另外,例如,当av源7的重放声音的初始音量b(1st)为与0阶相对应的“0”时,音量f(b1st)为与相同的0阶相对应的“4”。在该情况下,语音控制部14将b(1st):f(b1st)=0:4视为与画面比率0.5:0.5对应的音量比率0.5=0.5。

此外,例如,当av源7的重放声音的初始音量b(1st)为与20阶相对应的“13”时,音量f(b1st)为与相同的20阶相对应的上限“10”。在该情况下,语音控制部14将b(1st):f(b1st)=13:10视为与画面比率0.5:0.5对应的音量比率0.5=0.5。

在步骤st5中,语音控制部14在由后部乘客r来进行驾驶员视频的大小变更的操作的情况下(步骤st5“是”),前进至步骤st6,在除此以外的情况下(步骤st5“否”),前进至步骤st13。

在步骤st6中,语音控制部14对与在步骤st5中被变更的画面比率相对应的驾驶员d的说话语音的音量f(temp)进行计算。例如,语音控制部14通过下式(1)来对音量f(temp)进行计算。

f(temp)=wd/(1-wd)×f(b1st)(1)

在步骤st7中,语音控制部14在步骤st6中所计算出的音量f(temp)小于上限f(limit)时(步骤st7“是”),前进到步骤st8,在音量f(temp)在上限f(limit)以上时(步骤st7“否”),前进到步骤st10。

在步骤st8中,语音控制部14将驾驶员d的说话语音的音量f设定成在步骤st6中所计算出的音量f(temp)。

在步骤st9中,语音控制部14将av源7的重放声音的音量b设定为初始音量b(1st)。

在步骤st10中,语音控制部14将驾驶员d的说话语音的音量f设定为上限f(limit)。

在步骤st11中,语音控制部14对与在步骤st5中被变更的画面比率和在步骤st10中所设定的音量f相对应的av源7的重放声音的音量b进行计算。例如,语音控制部14通过下式(2)来对音量b进行计算。

b=(1-wd)/wd×b(1st)/f(b1st)×f(2)

在步骤st12中,语音控制部14向后置扬声器5语音输出被控制为在步骤st8和步骤st9中所设定的音量f和音量b的合成语音、或者被控制为在步骤st10和步骤st11中所设定的音量f和音量b的合成语音。

在步骤st13中,语音控制部14在由驾驶员d或后部乘客r来进行对话结束的操作的情况下(步骤st13“是”),前进至步骤st14,在除此以外的情况下(步骤st13“否”),返回至步骤st5。

在步骤st14中,语音控制部14将av源7的重放声音的音量b设定为对话开始前的初始音量b(1st)。此外,语音控制部14将驾驶员d的说话语音的音量f设为零,从而消音。语音控制部14使被控制为所设定的音量f和音量b的合成语音向后置扬声器5进行语音输出。

如以上那样,实施方式1的后置显示器4向后部乘客r显示对驾驶员d进行拍摄而得到的驾驶员视频。操作信息获取部11获取对在后置显示器4上显示的驾驶员视频的大小进行变更的操作信息。视频控制部13基于由操作信息获取部11获取到的操作信息,来对在后置显示器4上显示的驾驶员视频的大小进行变更。语音控制部14在生成将驾驶员d的说话语音与av源7的重放声音相组合而成的合成语音时,基于在后置显示器4上显示的驾驶员视频的大小,来控制驾驶员d的说话语音与av源7的重放声音之间的音量比率。后置扬声器5向后部乘客r输出由语音控制部14所生成的合成语音。由于驾驶员d的说话语音的音量与av源7的重放声音的音量相对变化,因此,后部乘客r能听取到与av源7的重放声音相重叠的驾驶员d的说话语音。因此,乘客间对话装置1可以使在车厢内驾驶员d与后部乘客r的对话变顺利。此外,后部乘客r通过对驾驶员视频的放大或缩小这样的操作,从而可以直观地调整音量。

此外,实施方式1的语音控制部14使驾驶员d的说话语音与av源7的重放声音之间的音量比率对应于驾驶员视频与后置显示器4的显示画面之间的画面比率。由此,后部乘客r通过对驾驶员视频的放大或缩小这样的视觉上的操作,从而可以直观地调整音量。

另外,在实施方式1中,虽然将后置显示器4的显示画面中除了驾驶员视频以外的区域的画面横向的长度与驾驶员视频的画面横向的长度之间的比率设为画面比率,但画面比率并不限于此。例如,画面比率也可以是后置显示器4的显示画面的面积与驾驶员视频的面积之间的比率等。

此外,实施方式1的语音控制部14通过优先变更驾驶员d的说话语音的音量,来控制驾驶员d的说话语音与av源7的重放声音之间的音量比率。然后,语音控制部14在驾驶员d的说话语音的音量变为预先设定的上限时,通过变更av源7的重放声音的音量,来控制上述音量比率。通过对驾驶员d的说话语音的音量设置上限,可防止因后部乘客r所进行的急剧的驾驶员视频的放大操作而造成从后置扬声器5语音输出大音量的说话语音这一情况。

另外,语音控制部14也可以通过优先变更av源7的重放声音的音量来取代驾驶员d的说话语音,从而控制驾驶员d的说话语音与av源7的重放声音之间的音量比率。

实施方式2.

图7是表示实施方式2所涉及的乘客间对话装置1的概要的概念图。图8是表示实施方式2所涉及的乘客间对话装置1的结构例的框图。相对于图1所示的实施方式1的乘客间对话装置1,实施方式2所涉及的乘客间对话装置1是追加了后部乘客用麦克风22、后部乘客用摄像头23、前置显示器24、前置扬声器25、第2视频控制部33、和第2语音控制部34的结构。在图7和图8中,与图1和图2相同或相当的部分标记相同的标号并省略说明。

实施方式1所涉及的乘客间对话装置1是将驾驶员d的说话语音从后置扬声器5朝向后部乘客r进行语音输出的结构。与此相对,实施方式2所涉及的乘客间对话装置1是在将驾驶员d的说话语音从后置扬声器5进行语音输出的同时、将后部乘客r的说话语音从前置扬声器25向驾驶员d进行语音输出的结构。

后部乘客用麦克风22和后部乘客用摄像头23被设置于后部座位周边。后部乘客用麦克风22采集后部乘客r的说话语音,并且输出到主单元6。后部乘客用摄像头23拍摄后部乘客r的脸部,并且作为后部乘客视频输出到主单元6。前置显示器24和前置扬声器25被设置在驾驶座周边。前置显示器24相当于第2显示部。前置扬声器25相当于第2语音输出部。

操作信息获取部11获取被输入至驾驶员用输入装置8的基于驾驶员d的操作信息、或被输入至后部乘客用输入装置9的基于后部乘客r的操作信息,并且将其输出到av源选择部12、视频控制部13、第2视频控制部33、语音控制部14、或第2语音控制部34。

av源选择部12从操作信息获取部11接收由驾驶员d进行的av源选择的操作信息。av源选择部12基于所接收到的操作信息来选择av源7,将所选择的av源7的视频信息输出至第2视频控制部33,并且将语音信息输出至第2语音控制部34。在图7的示例中,选择导航装置作为av源7,并且在前置显示器24上显示地图画面。av源选择部12能够基于驾驶员d和后部乘客r的操作信息,来为后置显示器4与前置显示器24选择不同的av源。

第2视频控制部33从后部乘客用摄像头23接收后部乘客视频,从av源选择部12接收av源7的重放视频。此外,第2视频控制部33从操作信息获取部11接收由驾驶员d或后部乘客r所进行的对话开始的操作信息、以及由驾驶员d所进行的后部乘客视频的大小变更的操作信息。通常,第2视频控制部33使从av源选择部12接收到的av源7的重放视频显示于前置显示器24。另一方面,第2视频控制部33在接收到对话开始的操作信息时,使将后部乘客视频与av源7的重放视频相重叠而得到的合成视频显示于前置显示器24。另外,第2视频控制部33在接收到后部乘客视频的大小变更的操作信息时,根据操作信息来变更后部乘客视频相对于av源7的重放视频的大小,并且使变更后的合成视频显示于前置显示器24。

第2语音控制部34从后部乘客用麦克风22接收后部乘客r的说话语音,从av源选择部12接收av源7的重放声音。此外,第2语音控制部34从操作信息获取部11接收由驾驶员d或后部乘客r所进行的对话开始的操作信息、以及由驾驶员d所进行的后部乘客视频的大小变更的操作信息。通常,第2语音控制部34使从av源选择部12接收到的av源7的重放声音语音输出至前置扬声器25。另一方面,第2语音控制部34在接收到对话开始的操作信息时,使将后部乘客r的说话语音与av源7的重放声音相组合而成的合成语音向前置扬声器25进行语音输出。另外,第2语音控制部34在接收到后部乘客视频的大小变更的操作信息时,控制后部乘客r的说话语音与av源7的重放声音之间的音量比率以使得与基于操作信息的后部乘客视频与av源7的重放视频之间的画面比率相对应,并且使控制后的合成语音向前置扬声器25进行语音输出。第2语音控制部34所进行的音量比率的控制方法与语音控制部14所进行的音量比率的控制方法相同,因而省略详细说明。

如以上那样,实施方式2的前置显示器24向驾驶员d显示对后部乘客r进行拍摄而得到的后部乘客视频。第2视频控制部33基于由操作信息获取部11获取到的、对被显示于前置显示器24的后部乘客视频的大小进行变更的操作信息,来对显示于前置显示器24的后部乘客视频的大小进行变更。第2语音控制部34在生成将后部乘客r的说话语音与av源7的重放声音相组合而成的合成语音时,基于在前置显示器24上显示的后部乘客视频的大小,来控制后部乘客r的说话语音与av源7的重放声音之间的音量比率。前置扬声器25向驾驶员d输出由第2语音控制部34所生成的合成语音。由于后部乘客r的说话语音的音量与av源7的重放声音的音量相对变化,因此,驾驶员d可听取到与av源7的重放声音相重叠的后部乘客r的说话语音。此外,乘客间对话装置1通过使得后部乘客r与驾驶员d容易听到彼此的说话语音,从而可进一步地使在车厢内驾驶员d与后部乘客r的对话变顺利。

另外,虽然在实施方式1和实施方式2中对第1乘客是驾驶员d、且第2乘客是后部乘客r的示例进行了说明,但是第1乘客和第2乘客也可以是车厢内的任一个乘客。例如,可以第1乘客是副驾驶座的乘客,第2乘客是后部乘客r。

最后,对各实施方式所涉及的乘客间对话装置1中的主单元6的硬件结构进行说明。

图9a和图9b是表示各实施方式所涉及的乘客间对话装置1中的主单元6的硬件结构例的图。主单元6中的操作信息获取部11、av源选择部12、视频控制部13、语音控制部14、第2视频控制部33、和第2语音控制部34的各功能由处理电路实现。即,主单元6包括用于实现上述各功能的处理电路。处理电路可为作为专用硬件的处理电路100,也可为执行存储器102中所存储的程序的处理器101。

如图9a所示,在处理电路是专用硬件的情况下,处理电路100相当于例如单一电路、复合电路、可编程处理器、并联可编程处理器、asic(applicationspecificintegratedcircuit:专用集成电路)、fpga(fieldprogrammablegatearray:现场可编程门阵列)、或它们的组合。操作信息获取部11、av源选择部12、视频控制部13、语音控制部14、第2视频控制部33、以及第2语音控制部34的功能可以通过多个处理电路100来实现,也可以汇集各部的功能通过1个处理电路100来实现。

如图9b所示那样,在处理电路为处理器101时,操作信息获取部11、av源选择部12、视频控制部13、语音控制部14、第2视频控制部33、以及第2语音控制部34的各功能通过软件、固件、或者软件与固件的组合来实现。软件或固件被记为程序,存储于存储器102。处理器101读取存储于存储器102中的程序并执行,从而实现各部的功能。即,主单元6包括存储器102,该存储器102用于存储在由处理器101执行时最终执行图5的流程图所示的步骤的程序。此外,该程序也可以说是使计算机执行操作信息获取部11、av源选择部12、视频控制部13、语音控制部14、第2视频控制部33、和第2语音控制部34的步骤或方法的程序。

这里,处理器101为cpu(centralprocessingunit:中央处理单元)、处理装置、运算装置、微处理器或微机等。

存储器102可以是ram(randomaccessmemory:随机存储器)、rom(readonlymemory:只读存储器)、eprom(erasableprogrammablerom:可擦可编程只读存储器)、或闪存等非易失性半导体存储器或易失性半导体存储器,也可以是硬盘或软盘等磁盘,也可以是cd或dvd等光盘。

另外,对于操作信息获取部11、av源选择部12、视频控制部13、语音控制部14、第2视频控制部33、以及第2语音控制部34的各功能,可用专用硬件来实现一部分,用软件或固件来实现一部分。如此,主单元6中的处理电路可利用硬件、软件、固件或它们的组合来实现上述各功能。

另外,本发明可以在该发明的范围内,对各实施方式进行自由组合,或对各实施方式的任意结构要素进行变形,或者省略各实施方式中的任意结构要素。

工业上的实用性

由于本发明所涉及的乘客间对话装置使在车厢内乘客彼此的对话变顺利,因此适用于icc系统等。

标号说明

1乘客间对话装置,2驾驶员用麦克风,3驾驶员用摄像头,4后置显示器(显示部),5后置扬声器(语音输出部),6主单元,7av源,8驾驶员用输入装置,9后部乘客用输入装置,11操作信息获取部,12av源选择部,13视频控制部,14语音控制部,22后部乘客用麦克风,23后部乘客用摄像头,24前置显示器(第2显示部),25前置扬声器(第2语音输出部),33第2视频控制部,34第2语音控制部,100处理电路,101处理器,102存储器,d驾驶员,r后部乘客。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1