车载声音收集装置以及声音收集方法与流程

文档序号:11064124阅读:896来源:国知局
车载声音收集装置以及声音收集方法与制造工艺

本公开涉及车室内的声音收集装置以及声音收集方法。



背景技术:

专利文献1公开了下述内容:一边使麦克风阵列(microphone array)的指向特性连续变化、一边检测说话者方向,通过信号处理来按每个说话者方向对麦克风阵列所取得的声音数据进行分离,对每个分离出的声音数据进行声音识别(段落[0027]、[0028])。由此,专利文献1如图10所示那样,当在驾驶席、副驾席等分别搭乘有说话者1010、1020的情况下,一边容易地使麦克风阵列1000的指向特性范围1110、1120、1130变化、一边取得声音数据,据此能够易于分别对每个说话者1010、1020、1030进行声音识别(段落[0044]、图8)。

现有技术文献

专利文献1:日本特开2003-114699号公报



技术实现要素:

发明所要解决的问题

然而,专利文献1所公开的现有技术有进一步改善的余地。

本公开提供一种即使在多个说话者在车室内同时发声的情况下,也能防止在想要收集的特定说话者的声音中混入其他说话者的声音的车载声音收集装置等。

用于解决问题的技术方案

本公开的一个技术方案的车载声音收集装置具备:第一麦克风,其在车室内设置于第一搭乘者就坐的第一座位位置附近;第二麦克风,其在所述车室内设置于第二搭乘者就坐的第二座位位置附近;混入音推定部,其基于所述第二麦克风所取得的第二信号,推定混入到所述第一麦克风的、所述第二搭乘者发出的声音即混入音;以及去噪部,其从所述第一麦克风所取得的第一信号中去除所述混入音。

发明效果

根据本发明,即使在多个搭乘者在车室内同时发声的情况下,也能够仅提取想要收集的特定说话者的声音,能够提高特定说话者的声音识别率。

附图说明

图1是表示本公开的实施方式1中的车载声音收集装置所适用的声音收集系统的整体结构的一例的图。

图2是表示本公开的实施方式1中的车载声音收集装置的处理的一例的流程图。

图3是表示本公开的实施方式2中的车载声音收集装置所适用的声音收集系统的整体结构的一例的图。

图4是表示本公开的实施方式2中的车载声音收集装置的变形例的图。

图5是表示本公开的实施方式3中的车载声音收集装置所适用的车载系统的整体结构的一例的图。

图6是表示本公开的实施方式3的车载声音收集装置的处理的一例的流程图。

图7是表示本公开的实施方式4的车载声音收集装置所适用的声音收集系统的整体结构的一例的图。

图8是说明发声判定部检测发声区间的处理的图。

图9是表示本公开的实施方式4的车载声音收集装置的处理的一例的流程图。

图10是说明现有技术的图。

标号说明

P1、P2、P3、P4:搭乘者

S1’、S2’、S3’、S4’:混入音信号

S1、S2、S3、S4:信号

SO:信号

SW1、SW2:开关(switch)

Sig2:包络线

ΔT1:发声区间

2、21、22、23:混入音推定部

2a、21a、21b、21c、2α:自适应滤波器

3:去噪部

5:车辆

6:发声判定部

11、12、13、14:麦克风

31、32:选择器

50:车室

51、52、53、54:座位

100:车载声音收集装置

200:后处理装置

具体实施方式

(得到本公开的一个技术方案的经过)

在车室内用声音输入设备收集搭乘者发出的声音,从所收集的声音中识别控制命令,并对设备进行控制的技术得到了实用化。一般使用麦克风作为声音输入设备。在该情况下,麦克风安装于被称为头顶控制台(overhead console)的、位于驾驶席和副驾席的中间的顶棚部分。因此,搭乘者能够以免提的方式输入声音。在头顶控制台设置有麦克风的情况下,麦克风位于离说话者的嘴边数十厘米的位置。因此,不仅是说话者的声音,连车室内的噪声也混入麦克风中的可能性变高。由此,存在麦克风所收集的声音的音质劣化,声音识别率降低这一问题。

为了解决该问题,作为麦克风,可考虑使用指向性麦克风。

然而,指向性麦克风的声音收集范围具有某种程度的指向角,另外,在被称为旁瓣(side lobe)的、指向性方向以外的方向上也具有灵敏度。因此,指向性麦克风未必能仅收集所针对的说话者的声音。再者,车室内空间狭小,在前面、侧面以及后面配置有多个容易反射声音的玻璃制的窗户。再者,前面和/或侧面的窗户位于搭乘者附近。因此,说话者以外的搭乘者的声音由窗户玻璃反射,声音会从各种方向到达指向性麦克风。其结果,在多个说话者同时发声的情况下,即使使指向性麦克风的指向性朝向想要收集的特定说话者的方向,指向性麦克风也会收集到特定说话者以外的声音。因此,在以对单一说话者的声音识别为前提的现状的声音识别装置中,以往的结构存在会使特定说话者的声音识别率降低这一问题。

另外,上述的专利文献1为,一边变更麦克风阵列的指向性的方向,一边确定说话者的方向。

然而,如上所述,在车室内,说话者的声音遍布在各种方向,声音从各种方向输入到麦克风阵列。因此,在专利文献1中,存在判定为在实际存在于车室内的说话者以外的方向上也存在说话者的可能性。因此,专利文献1无法准确地提取车室内的特定说话者的声音。

本公开解决这些问题,提供一种能够准确地提取车室内的特定的说话者的声音的车载声音收集装置等。

本公开的一个技术方案的车载声音收集装置具备:第一麦克风,其在车室内设置于第一搭乘者就坐的第一座位位置附近;第二麦克风,其在所述车室内设置于第二搭乘者就坐的第二座位位置附近;混入音推定部,其基于所述第二麦克风所取得的第二信号,推定混入到所述第一麦克风的、所述第二搭乘者发出的声音即混入音;以及去噪部,其从所述第一麦克风所取得的第一信号中去除所述混入音。

根据该构成,可基于第二麦克风所取得的第二信号,推定混入到第一麦克风的、第二搭乘者发出的声音即混入音。而且,可从第一麦克风所取得的第一信号中去除混入音。

因此,即使在多个搭乘者在车室内同时发声的情况下,也能够仅提取想要收集的特定说话者的声音,能够提高特定说话者的声音识别率。另外,在免提通话中,也能够去除由其他搭乘者的发声造成的干扰,获得高的声音识别率。

在上述技术方案中,也可以为,具备:第一开关,其配置于所述第一座位位置附近;以及第二开关,其配置于所述第二座位位置附近,(1)在所述第一开关被按下的情况下,所述混入音推定部基于所述第二信号,推定混入到所述第一麦克风的、所述第二搭乘者发出的声音即第一混入音,所述去噪部从所述第一信号中去除所述第一混入音,(2)在所述第二开关被按下的情况下,所述混入音推定部基于所述第一信号,推定混入到所述第二麦克风的、所述第一搭乘者发出的声音即第二混入音,所述去噪部从所述第二信号中去除所述第二混入音。

根据该构成,设置有第一开关以及第二开关,因此,能够准确地决定第一搭乘者和第二搭乘者中的哪一个是特定说话者。

在上述技术方案中,也可以为,还具备发声判定部,其判定所述第一信号以及所述第二信号中是否包括发声区间,(1)在所述发声判定部判定为所述第一信号中包括发声区间的情况下,所述混入音推定部基于所述第二信号,推定混入到所述第一麦克风的、所述第二搭乘者发出的声音即第一混入音,所述去噪部从所述第一信号中去除所述第一混入音,(2)在所述发声判定部判定为所述第二信号中包括发声区间的情况下,所述混入音推定部基于所述第一信号,推定混入到所述第二麦克风的、所述第一搭乘者发出的声音即第二混入音,所述去噪部从所述第二信号中去除所述第二混入音。

根据该构成,在第一信号中包括发声区间的情况下,提取第一搭乘者的声音,在第二信号中包括发声区间的情况下,提取第二搭乘者的声音。因此,能够自动地决定第一搭乘者以及第二搭乘者中的哪一个是特定说话者。

在上述技术方案中,也可以为,对所述第一信号以及所述第二信号预先设定有优先级,(3)在所述发声判定部判定为所述第一信号以及所述第二信号中均包括发声区间的情况下,如果所述第一信号的优先级比所述第二信号高,则所述混入音推定部推定所述第一混入音,所述去噪部从所述第一信号中去除所述第一混入音,(4)在所述发声判定部判定为所述第一信号以及所述第二信号中均包括发声区间的情况下,如果所述第二信号的优先级比所述第一信号高,则所述混入音推定部推定所述第二混入音,所述去噪部从所述第二信号中去除所述第二混入音。

根据该构成,在第一信号以及第二信号中均包括发声区间的情况下,如果第一信号的优先级比第二信号高,则提取第一搭乘者的声音,如果第二信号的优先级比第一信号高,则提取第二搭乘者的声音。因此,能够防止在第一搭乘者以及第二搭乘者同时发声时无法决定哪一个是特定说话者这一情况。

在上述技术方案中,也可以为,所述第一麦克风以及所述第二麦克风是单一指向性麦克风。

根据该构成,在使用了单一指向性麦克风的情况下,能够准确地提取特定说话者的声音。

在上述技术方案中,也可以为,所述第一麦克风以及所述第二麦克风是由多个麦克风单元构成的阵列式麦克风(array-microphone)。

根据该构成,在使用了阵列式麦克风的情况下,能够准确地提取特定说话者的声音。

在上述技术方案中,也可以为,所述混入音推定部使用自适应滤波器来推定所述混入音,所述自适应滤波器的滤波系数校正为使得来自所述去噪部的输出信号与输入信号不相关或者独立。

根据该构成,使用自适应滤波器来推定混入音,因此,能够准确地求出混入音。另外,由于使用了自适应滤波器,因此能够随着使用而使推定混入音的准确性提高。

在上述技术方案中,也可以为,所述发声判定部针对所述第一信号以及所述第二信号分别计算包络线,检测所述计算出的包络线的最低水平(level),基于所述检测到的最低水平来设定阈值,将所述第一信号以及所述第二信号的水平大于所述设定的阈值的区间判定为所述发声区间。

根据该构成,根据包络线的最低水平而设定了阈值,因此,相比于使阈值固定的情况,能够设定与场面相应的适合的阈值。

(实施方式1)

图1是表示本公开的实施方式1中的车载声音收集装置100所适用的声音收集系统的整体结构的一例的图。声音收集系统具备车载声音收集装置100以及后处理装置200。

车载声音收集装置100具备麦克风11、12、混入音推定部2以及去噪部3。麦克风11(第一麦克风的一例)在车室50内设置于搭乘者P1(第一搭乘者的一例)就坐的座位51(第一座位的一例)的位置附近,是主要用于对搭乘者P1的声音进行收集的麦克风。麦克风12(第二麦克风的一例)在车室50内设置于搭乘者P2(第二搭乘者的一例)就坐的座位52(第二座位的一例)的位置附近,是主要用于对搭乘者P2的声音进行收集的麦克风。

在图1的例子中,麦克风11配置于搭乘者P1的上侧、且车室50的顶棚部,麦克风12配置于搭乘者P2的上侧、且车室50的顶棚部。具体而言,麦克风11安装于设置在顶棚部的搭乘者P1的遮阳板(sun visor),麦克风12安装于设置在顶棚部的搭乘者P2的遮阳板即可。或者,也可以为,麦克风11设置于搭乘者P1的前方的仪表盘(dashboard),麦克风12设置于搭乘者P2的前方的仪表盘。或者,麦克风11、12分别可以设置于设置在座位51及座位52之间的中央控制台(center console),也可以设置于设置在中央控制台上侧的顶棚部的头顶控制台(overhead console)。总之,只要是能够对搭乘者P1、P2的声音进行收集的车室50内的位置,麦克风11、12可以配置于任意的位置。

作为麦克风11、12,可采用单一指向性麦克风或者阵列式麦克风。在采用单一指向性麦克风的情况下,麦克风11、12例如配置为使指向性分别朝向搭乘者P1、P2的头部。阵列式麦克风是多个麦克风单元接近地排列从而排列成阵列状的麦克风,是能够通过信号处理使指向性朝向任意方向的麦克风。在采用阵列式麦克风的情况下,麦克风11、12事先检测搭乘者P1、P2各自的方向,并决定指向性的方向以使其朝向检测到的方向即可。该处理例如通过未图示的处理器和/或CPU来执行即可。

混入音推定部2基于麦克风12所取得的信号S2(第二信号的一例),推定表示混入到麦克风11的、搭乘者P2发出的声音即混入音的混入音信号S2’。

在此,混入音推定部2具备自适应滤波器2a,使用自适应滤波器2a来推定混入音信号S2’即可。具体而言,混入音推定部2使用预定的自适应算法,校正自适应滤波器2a的滤波系数,以使得从去噪部3输出的信号SO(输出信号的一例)与自适应滤波器2a的输入不相关或者独立。如后所述,信号SO是麦克风11所取得的信号S1(第一信号的一例)减去混入音信号S2’而得到的信号。因此,若校正自适应滤波器2a的滤波系数以使得信号SO与自适应滤波器2a的输入不相关或者独立,则从自适应滤波器2a输出的信号就表示混入音信号S2’,所述混入音信号S2’表示包含于信号S1的、搭乘者P2发出的声音混入到搭乘者P1发出的声音而成的声音即混入音。

此外,混入音推定部2既可以定期地执行滤波系数的校正处理,也可以在每当麦克风12取得一定水平以上的信号时执行。在此,作为预定的自适应算法,能够采用LMS(The least-mean-square,最小均方)算法和/或ICA(Independent Component Analysis,独立成分分析)算法。作为自适应滤波器,可以采用LMS滤波器。

去噪部3从信号S1中减去混入音信号S2’,生成信号SO。在此,混入音信号S2’表示包含于信号S1的搭乘者P2发出的声音即混入音。因此,即使在搭乘者P1、搭乘者P2同时发声的情况下,信号SO也表示作为特定说话者的搭乘者P1发出的声音。

在图1中,混入音推定部2以及去噪部3既可以由DSP(数字信号处理器)等处理器构成,也可以通过CPU执行存储于ROM的控制程序来实现。这在后述的实施方式中也是相同的。

后处理装置200例如由声音识别装置构成,使用信号SO来进行声音识别。在此,声音识别装置使用公知的声音识别方法来进行声音识别即可。在图1的例子中,信号SO表示搭乘者P1发出的声音,因此,声音识别装置识别搭乘者P1发出的声音。

在此,作为被识别的声音,相当于用于控制各种设备的控制命令。作为控制命令,例如可以采用用于操作车辆5所具备的设备的控制命令。作为车辆5所具备的设备,例如可以采用空调设备、导航装置、定速巡航(cruise control)装置、电视机以及照明等。例如,若声音识别装置识别到调整空调设备的温度的控制命令,则空调设备的温度会被设定为识别出的控制命令所表示的温度。

此外,作为后处理装置200,也可以采用声音识别装置以外的例如免提装置。免提装置是搭乘者用于通过声音来操作手机的装置。例如,免提装置使用蓝牙(Bluetooth)(注册商标)等通信方式将信号SO发送到手机。

车辆5例如由4轮汽车构成,具备车室50。在图1的例子中,采用了5人座的乘用车作为车辆5,但这是一个例子,也可以采用两人座或者7人座等的乘用车作为车辆5。另外,作为车辆5,也可以采用乘用车以外的大巴、卡车。

车室50具备座位51~54。座位51是配置于方向盘55的后方的驾驶席,由作为驾驶员的搭乘者P1就坐。

座位52是在俯视图中配置于座位51的左侧的副驾席,由搭乘者P2就坐。座位53、54是后部座位,分别设置于座位51、52的后方。

图2是表示本公开的实施方式1中的车载声音收集装置100的处理的一例的流程图。此外,图2所示的流程图既可以每隔一定的时间间隔而执行,也可以在麦克风11、12收集到一定水平以上的声音的情况下而执行。这在后述的图6、图9的流程图中也是相同的。首先,麦克风11、12分别取得信号S1、S2(S301)。

接下来,混入音推定部2通过使用自适应滤波器2a对信号S2进行滤波,推定表示包含于信号S1的搭乘者P2发出的声音即混入音的混入音信号S2’(S302)。

接下来,去噪部3通过从信号S1中减去混入音信号S2’,生成信号SO。

这样,根据本实施方式,即使在多个搭乘者在车室内同时发声的情况下,也能够仅提取想要收集的特定说话者的声音,能够提高特定说话者的声音识别率。

此外,在上述说明中,说明了搭乘者P1为特定说话者,但也可以是搭乘者P2为特定说话者。在该情况下,在麦克风11以及去噪部3之间连接混入音推定部2,将麦克风12与去噪部3连接即可。

(实施方式2)

实施方式2的特征在于,除了前部座位以外,对后部座位也设置有麦克风。此外,在本实施方式中,对与实施方式1相同的构成要素,附加相同标号,并省略说明。图3是表示本公开的实施方式2中的车载声音收集装置100所适用的声音收集系统的整体结构的一例的图。

在图3中,与图1的不同点在于:对后部座位即座位53、54分别设置有麦克风13、14;设置有与麦克风12、13、14各自对应的3个混入音推定部21、22、23。

在图3的例子中,将搭乘者P1作为特定说话者,但这是一例,也可以将搭乘者P2、P3、P4中的某一个作为特定说话者。

麦克风13例如配置于座位53的上侧的顶棚部,主要对搭乘者P3的声音进行收集。麦克风14例如配置于座位54的上侧的顶棚部,主要对搭乘者P4的声音进行收集。与实施方式1同样地,麦克风13、14既可以采用单一指向性麦克风,也可以采用阵列式麦克风。麦克风13、14的指向性分别朝向搭乘者P3、P4的方向。

以下,设麦克风13取得的信号为信号S4,设麦克风14取得的信号为信号S3。

混入音推定部21、22、23分别具备自适应滤波器21a、21b、21c。混入音推定部21使用信号S2和信号SO,推定表示混入麦克风11的、搭乘者P2发出的声音即混入音的混入音信号S2’。在此,与实施方式1同样地,混入音推定部21使用预定的自适应算法来校正自适应滤波器21a的滤波系数以使得信号SO与自适应滤波器21a的输入不相关或者独立,通过使用该自适应滤波器21a,对信号S2进行滤波,从而推定混入音信号S2’。混入音信号S2’是使用信号S2而推定出的信号,因此,主要表示混入信号S1中的搭乘者P2的声音。

混入音推定部22、23也与混入音推定部21同样地,分别使用信号S3、S4,来推定混入音信号S3’、S4’。在此,混入音信号S3’、S4’分别是使用信号S3、S4而推定出的信号,因此,主要表示混入信号S1中的搭乘者P3、P4的声音。

去噪部3通过从信号S1中减去混入音信号S2’、S3’、S4’,生成信号SO。由此,能获得将特定说话者即搭乘者P1发出的声音以外的信号作为噪声从信号S1中去除后得到的信号,以作为信号SO。

这样,在实施方式2中,在对作为后部座位的座位53、54分别设置有麦克风13、14的情况下,也能够仅提取特定说话者的声音。

此外,在图3中,在设特定说话者为搭乘者P1以外的搭乘者P2、P3、P4中的某一个搭乘者的情况下,对与这一个搭乘者以外的搭乘者对应的3个麦克风分别连接混入音推定部21、22、23即可。

图4是表示本公开的实施方式2中的车载声音收集装置100的变形例的图。在图3中,麦克风11~14分别设置于俯视图中的对应座位的左右方向的中央。相对于此,在图4中,麦克风11~14分别在俯视图中隔着从车室50的左右方向的正中经过的中心线而在左右方向上邻接地配置。在采用图4的技术方案的情况下,麦克风11、12设置于设置在车室50的顶棚部的前部座位用的头顶控制台即可。另外,麦克风13、14设置于设置在车室50的顶棚部的后部座位用的头顶控制台即可。此外,不论在采用图3、图4中的哪一个方式的情况下,麦克风11~14的指向性分别设定为朝向对应的搭乘者P1~P4的头部即可。

(实施方式3)

实施方式3的车载声音收集装置100的特征在于,具备用于指定特定说话者的开关。图5是表示本公开的实施方式3中的车载声音收集装置100所适用的车载系统的整体结构的一例的图。此外,在本实施方式中,对与实施方式1相同的构成要素,附加相同标号,并省略说明。

在图5中,与图1的不同点在于:设置有开关SW1、SW2以及选择器31、32。开关SW1、SW2例如由按钮式的开关构成,分别配置于座位51、52的附近。在此,开关SW1、SW2例如配置于车室50内的顶棚部。在图5的例子中,开关SW1、SW2以在俯视图中隔着从车室50的左右方向的正中经过的中心线而在左右方向上邻接的方式配置于头顶控制台。但是,开关SW1、SW2的配置位置并不限定于此,只要是搭乘者P1、P2能够操作的位置,则分别可以配置于任意的位置。例如,也可以在仪表盘、中央控制台和/或座位51、52的座部的背面侧,配置开关SW1、SW2。

开关SW1、SW2分别相对于顶棚面凹陷自如地构成,例如,在从顶棚面凹陷的状态下变为接通(ON),在与顶棚面位于同一面上的状态下变为断开(OFF)。另外,开关SW1、SW2例如构成为排他性地接通以使得不会同时变为接通。开关SW1在将搭乘者P1作为特定说话者的情况下被接通,开关SW2在将搭乘者P2作为特定说话者的情况下被接通。以下,设为开关SW1、SW2不会同时被接通。

选择器31在开关SW1接通且开关SW2断开的情况下,选择信号S1并输出至去噪部3。另外,选择器31在开关SW1断开且开关SW2接通的情况下,选择信号S2并输出至去噪部3。

选择器32在开关SW1接通且开关SW2断开的情况下,选择信号S2并输出至混入音推定部2。另外,选择器32在开关SW1断开且开关SW2接通的情况下,选择信号S1并输出至混入音推定部2。

此外,选择器31、32既可以由DSP构成,也可以通过CPU执行存储于ROM的控制程序来实现。这在实施方式4中也是相同的。

混入音推定部2在开关SW1接通且开关SW2断开的情况下,被输入信号S2,使用自适应滤波器2α来推定混入音信号S2’(第一混入音信号的一例)。另一方面,混入音推定部2在开关SW1断开且开关SW2接通的情况下,被输入信号S1,使用自适应滤波器2α来推定混入音信号S1’(第二混入音信号的一例)。

在此,与实施方式1同样地,在由选择器32选择了信号S2的情况下,自适应滤波器2α是下述滤波器:使用预定的自适应算法,校正了其滤波系数,以使得信号SO与自适应滤波器2α的输入不相关或者独立。因此,混入音信号S2’表示包含于信号S1的、搭乘者P2发出的声音即混入音。

另外,与实施方式1同样地,在由选择器32选择了信号S1的情况下,自适应滤波器2α是下述滤波器:使用预定的自适应算法,校正了其滤波系数,以使得信号SO与自适应滤波器2α的输入不相关或者独立。因此,混入音信号S1’表示包含于信号S2的、搭乘者P1发出的声音即混入音。

图6是表示本公开的实施方式3的车载声音收集装置100的处理的一例的流程图。首先,麦克风11、12分别取得信号S1、S2(S601)。

接下来,如果开关SW1接通(S602中的判断结果为“是”),则选择器31选择信号S1并输出至去噪部3,选择器32选择信号S2并输出至混入音推定部2(S603)。

接下来,混入音推定部2使用自适应滤波器2α对信号S2进行滤波,推定混入音信号S2’,并输出至去噪部3(S604)。

接下来,去噪部3从信号S1中减去混入音信号S2’,生成信号SO(S605)。

在开关SW1断开且开关SW2接通的情况下(S602中的判断结果为“否”且S606中的判断结果为“是”),选择器31选择信号S2并输出至去噪部3,选择器32选择信号S1并输出至混入音推定部2(S607)。

接下来,混入音推定部2使用自适应滤波器2α对信号S1进行滤波,推定混入音信号S1’,并输出至去噪部3(S608)。

接下来,去噪部3从信号S2中减去混入音信号S1’,生成信号SO(S609)。

在开关SW1断开且开关SW2断开的情况下(S602中的判断结果为“否”且S606中的判断结果为“否”),处理结束。

这样,在本实施方式中,设置有开关SW1、SW2,因此,能够准确地决定搭乘者P1、P2中的哪一个是特定说话者。

此外,在图6的流程图中,在开关SW1断开且开关SW2断开的情况下(S602中的判断结果为“否”且S606中的判断结果为“否”),结束了处理,但本公开并不限定于此。例如,在开关SW1断开且开关SW2断开的情况下,选择器31、32分别可以将搭乘者P1判定为特定说话者,并选择信号S1、S2,也可以将搭乘者P2判定为特定说话者,并选择信号S2、S1。或者,如果如后述的实施方式4所示的那样对信号S1、S2设定有优先级,则选择器31、32也可以将与信号S1、S2中优先级高的一方对应的搭乘者判定为特定说话者。或者,也可以将与信号S1、S2中水平高的一方的信号对应的搭乘者判定为特定说话者。此外,优先级是事先所设定的,例如预先存储于存储装置。另外,优先级也可以为能够根据搭乘者的操作而事后变更。

另外,在图5的例子中,设置了2个麦克风11、12,但本公开并不限定于此,也可以如图3所示那样设置麦克风13、14。

(实施方式4)

实施方式4的车载声音收集装置100的特征在于,将在发声的搭乘者决定为特定说话者。图7是表示本公开的实施方式4的车载声音收集装置100所适用的声音收集系统的整体结构的一例的图。此外,在本实施方式中,对与实施方式1相同的构成要素,附加相同标号,并省略说明。

在图7中,与图1的不同点在于:设置有发声判定部6以及选择器31、32。发声判定部6判定信号S1、S2中是否包括发声区间。图8是说明发声判定部6检测发声区间的处理的图。在图8中,纵轴表示麦克风11、12所取得的信号(以下记载为“声音信号Sig1”)的水平,横轴表示时间。

声音信号Sig1具有振幅高频变动的波形。发声判定部6针对声音信号Sig1设定处理区间ΔT。此外,以沿时间轴挪动一定的时间间隔的方式设定处理区间ΔT。接下来,发声判定部6在处理区间ΔT内求出声音信号Sig1的包络线Sig2。在图8中,包络线Sig2设定于声音信号Sig1的上侧,但这是一例,也可以设定于下侧。

接下来,发声判定部6检测包络线Sig2的最低水平A1。接下来,发声判定部6将使最低水平A1倍增预定倍而得到的值设定为阈值Th。在此,对最低水平A1乘以比1大的数(例如2、3这样的数)。

接下来,发声判定部6将声音信号Sig1的水平在阈值Th以上的区间判定为发声区间ΔT1。

此外,发声判定部6既可以由DSP构成,也可以通过CPU执行存储于ROM的控制程序来实现。

重新参照图7。在发声判定部6判定为信号S1中包括发声区间的情况下,选择器31选择信号S1并输出至去噪部3,选择器32选择信号S2并输出至混入音推定部2。

另外,在发声判定部6判定为信号S2中包括发声区间的情况下,选择器31选择信号S2并输出至去噪部3,选择器32选择信号S1并输出至混入音推定部2。

再者,在发声判定部6判定为信号S1、S2这两者中包括发声区间的情况下,如果信号S1的优先级比信号S2高,则选择器31选择信号S1并输出至去噪部3,选择器32选择信号S2并输出至混入音推定部2。

再者,在发声判定部6判定为在信号S1、S2这两者中包括发声区间的情况下,如果信号S2的优先级比信号S1高,则选择器31选择信号S2并输出至去噪部3,选择器32选择信号S1并输出至混入音推定部2。

与实施方式3同样地,混入音推定部2具备自适应滤波器2α。混入音推定部2被输入由选择器32选择的信号S2,使用自适应滤波器2α来推定混入音信号S2’(第一混入音信号的一例)。另外,混入音推定部2被输入由选择器32选择的信号S1,使用自适应滤波器2α来推定混入音信号S1’(第二混入音信号的一例)。

图9是表示本公开的实施方式4的车载声音收集装置100的处理的一例的流程图。首先,麦克风11、12分别取得信号S1、S2(S901)。接下来,发声判定部6分别从信号S1、S2中检测发声区间(S902)。

在仅信号S1中包括发声区间的情况下(S903中的判断结果为“是”且S904中的判断结果为“否”),选择器31选择信号S1并输出至去噪部3,选择器32选择信号S2,并输出至混入音推定部2(S906)。

接下来,混入音推定部2使用自适应滤波器2α对信号S2进行滤波,推定混入音信号S2’,并输出至去噪部3(S907)。

接下来,去噪部3从信号S1中减去混入音信号S2’,生成信号SO(S908)。

另一方面,在仅信号S2中包括发声区间的情况下(S903中的判断结果为“否”且S910中的判断结果为“是”),选择器31选择信号S2并输出至去噪部3,选择器32选择信号S1并输出至混入音推定部2(S911)。

接下来,混入音推定部2使用自适应滤波器2α对信号S1进行滤波,推定混入音信号S1’,并输出至去噪部3(S912)。

接下来,去噪部3从信号S2中减去混入音信号S1’,生成信号SO(S913)。

在信号S1以及信号S2中包括发声区间的情况下(S903中的判断结果为“是”且S904中的判断结果为“是”),如果信号S1的优先级比信号S2高(S905中的判断结果为“是”),则执行上述的S906、S907、S908的处理。

另一方面,如果信号S2的优先级比信号S1高(S905中判断结果为“否”),则执行上述的S911、S912、S913的处理。

在信号S1以及信号S2中均未包括发声区间的情况下(S903中的判断结果为“否”且S910中的判断结果为“否”),处理结束。

这样,根据本实施方式,在信号S1中包括发声区间的情况下,提取搭乘者P1的声音,在信号S2中包括发声区间的情况下,提取搭乘者P2的声音。因此,能够自动地决定搭乘者P1、P2中的哪一个是特定说话者。

另外,在信号S1、S2中均包括发声区间的情况下,根据信号S1、S2的优先级,提取搭乘者P1、P2中的某一方的声音。因此,能够防止在搭乘者P1、P2同时发声时无法决定哪一个是特定说话者这一情况。

此外,在本实施方式中,在信号S1、S2中均包括发声区间的情况下,根据信号S1、S2的优先级来决定成为去噪对象的信号,但本公开并不限定于此。例如,也可以将信号S1、S2中水平高的一方的信号决定为成为去噪对象的信号。在该情况下,发声判定部6计算发声区间内的信号的平均水平,将平均水平高的一方的信号决定为成为去噪对象的信号即可。而且,在发声判定部6判定为信号S1的水平比信号S2高的情况下,选择器31、32、混入音推定部2以及去噪部3进行与上述的信号S1的优先级比信号S2高的情况下的处理相同的处理即可。另一方面,在发声判定部6判定为信号S2的水平比信号S1高的情况下,选择器31、32、混入音推定部2以及去噪部3进行与上述的信号S2的优先级比信号S1高的情况下的处理相同的处理即可。

另外,在图7的例子中,设置了2个麦克风11、12,但本公开并不限定于此,也可以如图3所示那样设置麦克风13、14。

另外,在实施方式1~4中,说明了将麦克风以及开关设置于座位的附近的情况,但也可以设置于座位。在该情况下,麦克风以及开关例如设置于座位的头枕(headrest)等即可。另外,后部座位的麦克风例如也可以配置于前部座位的后部座位侧的面。即,在本公开中“座位位置附近”是指一种包括座位的概念。

产业上的可利用性

关于本公开的车载声音收集装置,即使在多个搭乘者在车室内同时发声的情况下,也能够仅提取想要收集的特定说话者的声音,因此,对在车室内进行声音识别的技术是有用的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1