噪音去除装置及噪音去除方法与流程

文档序号:20502686发布日期:2020-04-21 22:52阅读:309来源:国知局
噪音去除装置及噪音去除方法与流程

本发明涉及将从所希望的方向到来的声音以外的噪音去除的技术。



背景技术:

以往,存在如下的噪音去除技术:利用由多个声学传感器(例如麦克风)构成的传感器阵列,对从各传感器得到的观测信号实施规定的信号处理,由此,强调从所希望的方向到来的声音,去除该声音以外的噪音。

通过上述的噪音去除技术,例如,能够使由于从空调设备等设备中产生的噪声而难以听到的声音清晰化,或者能够在多个说话人同时讲话时仅提取所希望的说话人的声音。这样,噪音去除技术不仅容易使人听到声音,而且还去除噪音作为声音识别处理的预处理,由此,能够提高声音识别处理的相对于噪音的健壮性。

以往公开了各种利用传感器阵列并通过信号处理而提高指向性的技术。例如,在非专利文献1中公开了如下的技术:利用事先测定或生成的表示目标声的到来方向的导向矢量(steeringvector),在不使从目标声的到来方向到来的声音的增益变化的条件下,统计地计算使输出信号的平均增益最小化的线性滤波器系数,从而进行线性波束成形,由此去除目标声以外的噪音。

但是,在上述的非专利文献1所公开的技术中,为了计算用于适当地去除噪音的线性滤波器系数,干扰声的观测信号需要某种程度的长度。这是因为,事先未提供与干扰声源的位置相关的信息,因此,需要根据观测信号来估计干扰声源的位置。由此,在非专利文献1所公开的技术中,存在如下问题:在刚开始噪音去除处理之后,得不到充分的噪音去除处理性能。

为了解决该问题,在专利文献1所记载的声信号处理装置中,事先生成表示目标声的到来方向的导向矢量,计算按照每个时频(time-frequency)根据观测信号计算的传感器间的相位差与根据目标声的到来方向的导向矢量计算的传感器间的相位差的相似度,将仅使相似度高的时频谱通过的时频掩蔽(time-frequencymasking)应用于观测信号,由此去除噪音。

现有技术文献

专利文献

专利文献1:日本特开2012-234150号公报

非专利文献

非专利文献1:浅野太,“音のアレイ信号処理音源の定位·追跡と分離”,株式会社corona公司,2011年,86-88页



技术实现要素:

发明要解决的问题

上述的专利文献1所记载的声信号处理装置不使用统计的计算,输出信号仅通过其瞬间的观测信号来决定,因此,从刚开始噪音去除处理之后得到稳定的噪音去除性能。

但是,专利文献1所记载的声信号处理装置为了提取目标声,仅使用目标声的到来方向作为与声源的到来方向相关的信息,因此,未考虑干扰声源相对于目标声源存在于哪个位置。因此,专利文献1所记载的声信号处理装置存在如下问题:在目标声的到来方向与干扰声的到来方向接近的情况下,或者在通过传感器阵列而观测的目标声与干扰声的相位差的差异较小的情况下等,噪音去除性能下降。

这是因为,在难以产生目标声与干扰声的相位差的低频率区域的时频掩蔽中,使干扰声的时频谱误通过的可能性高,难以得到高品质的输出信号。

本发明是为了解决上述问题而完成的,其目的在于,即便在目标声的到来方向与干扰声的到来方向接近的情况下,也实现良好的噪音去除性能,并且从刚开始噪音去除处理之后实现稳定的噪音去除性能。

用于解决问题的手段

本发明的噪音去除装置具备:目标声矢量选择部,其从预先取得的、表示声音相对于传感器阵列的到来方向的导向矢量中选择表示目标声的到来方向的目标声导向矢量,其中,该传感器阵列具备2个以上的声学传感器;干扰声矢量选择部,其从预先取得的导向矢量中选择表示目标声以外的干扰声的到来方向的干扰声导向矢量;以及信号处理部,其基于从传感器阵列得到的2个以上的观测信号、目标声矢量选择部选择出的目标声导向矢量、以及干扰声矢量选择部选择出的干扰声导向矢量,取得从观测信号去除了干扰声的信号。

发明的效果

根据本发明,即便在目标声的到来方向与干扰声的到来方向接近的情况下,也能够实现良好的噪音去除性能,并且能够在刚开始噪音去除处理之后实现稳定的噪音去除性能。

附图说明

图1是示出实施方式1的噪音去除装置的结构的框图。

图2a、图2b是示出实施方式1的噪音去除装置的硬件结构例的图。

图3是示出实施方式1的噪音去除装置的信号处理部的动作的流程图。

图4是示出实施方式2的噪音去除装置的信号处理部的动作的流程图。

图5是示出实施方式1或实施方式2的噪音去除装置的应用例的图。

图6是示出实施方式1或实施方式2的噪音去除装置的应用例的图。

具体实施方式

以下,为了更加详细地说明本发明,按照附图对该具体实施方式进行说明。

此外,在用于实施本发明的方式中,使用无指向性的麦克风且传感器阵列使用麦克风阵列来,来说明声学传感器的具体例。并且,声学传感器不限于无指向性麦克风,例如也能够应用指向性麦克风或超声波传感器。

实施方式1.

图1是示出实施方式1的噪音去除装置100的结构的框图。

噪音去除装置100具备观测信号取得部101、矢量存储部102、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105。

此外,在噪音去除装置100连接有具备多个麦克风200a、200b、200c、…的麦克风阵列200及外部设备300。

噪音去除装置100的信号处理部105基于通过麦克风阵列200观测到的观测信号、以及存储于矢量存储部102的导向矢量中的由目标声矢量选择部103及干扰声矢量选择部104选择并输出的导向矢量,生成从观测信号去除了噪音的输出信号并输出到外部设备300。

观测信号取得部101进行通过麦克风阵列200观测到的观测信号的a/d转换,转换成数字信号。观测信号取得部101将转换成数字信号的观测信号输出到信号处理部105。

矢量存储部102是存储预先测定或生成的多个导向矢量的存储区域。导向矢量是与从麦克风阵列200观察到的声音的到来方向对应的矢量。存储于矢量存储部102的导向矢量是如下得到的频谱,即,针对使用麦克风阵列200事先测定的相对于某个方向的脉冲响应进行离散傅里叶变换,并将得到的频谱除以任意的麦克风的频谱而进行归一化。即,将使用频谱s1(ω)~sm(ω)而构成的以下的式(1)所示的复矢量a(ω)设为导向矢量,其中,该频谱s1(ω)~sm(ω)是在将构成麦克风阵列200的麦克风的数量设为m时,对通过m个麦克风测定出的脉冲响应进行离散傅里叶变换而得到的。在式(1)中,ω表示离散频率,t表示矢量的转置。

并且,导向矢量并非必须通过与上述的式(1)同样的方法而求出。例如,在上述的式(1)中,通过与m个麦克风中的第1个麦克风对应的频谱s1(ω)进行归一化,但也可以通过与第1个以外的麦克风对应的频谱进行归一化。此外,也可以不进行归一化,而将脉冲响应的频谱直接用作导向矢量。但是,在以下的说明中,导向矢量如式(1)所示那样通过与第1个麦克风对应的频谱而被归一化。

目标声矢量选择部103从存储于矢量存储部102的导向矢量中选择表示所希望的声音到来的方向的导向矢量(以下称为目标声导向矢量)。目标声矢量选择部103将选择出的目标声导向矢量输出到信号处理部105。目标声矢量选择部103选择目标声导向矢量的方向例如是基于根据用户的输入指定的所希望的声音到来的方向而设定的。

干扰声矢量选择部104从存储于矢量存储部102的导向矢量中选择成为去除对象的噪音到来的方向的导向矢量(以下称为干扰声导向矢量)。干扰声矢量选择部104将选择出的干扰声导向矢量输出到信号处理部105。干扰声矢量选择部104选择干扰声导向矢量的方向例如是基于根据用户的输入指定的去除对象的噪音到来的方向而设定的。

但是,能够采用如下结构:在目标声源与干扰声源的位置关系不变化的状况下,目标声矢量选择部103持续单一的目标声的到来方向的导向矢量的输出,干扰声矢量选择部104持续单一的干扰声的到来方向的导向矢量的输出。

也可以采用如下结构:在分别存在多个目标声源和多个干扰声源的情况下,目标声矢量选择部103输出多个目标声导向矢量,干扰声矢量选择部104输出多个干扰声导向矢量。在该情况下,由于存在多个目标声源,因此,噪音去除装置100也可以将去除了噪音的多个目标声作为多个输出信号而输出。

但是,以下为了简化说明,目标声矢量选择部103及干扰声矢量选择部104分别选择并输出单一的目标声导向矢量及干扰声导向矢量。即,信号处理部105的输出信号为去除了单一的噪音的目标声的信号。并且,以下将目标声矢量选择部103选择并输出的目标声导向矢量记载为目标声导向矢量atrg(ω)。同样,将干扰声矢量选择部104选择并输出的干扰声导向矢量记载为干扰声导向矢量adst(ω)。

信号处理部105根据从观测信号取得部101得到的观测信号、从目标声矢量选择部103得到的目标声导向矢量、以及从干扰声矢量选择部104得到的干扰声导向矢量,将去除了目标声以外的噪音的信号作为输出信号而输出。这里,作为信号处理部105的一例,示出基于线性波束成形的安装方法。

以下,信号处理部105对通过m个麦克风观测到的信号实施离散傅里叶变换,取得时频谱x1(ω,τ)~xm(ω,τ)。这里,τ表示离散帧编号。信号处理部105基于以下所示的式(2),根据线性波束成形而求出输出信号的时频谱y(ω,τ)。如式(3)所示,式(2)中的x(ω,τ)是从时频谱x1(ω,τ)排列至xm(ω,τ)而得到的复矢量。此外,式(2)中的w(ω)是将线性波束成形中的线性滤波器系数排列而得到的复矢量。此外,式(2)中的h表示矢量或矩阵的复共轭转置。

y(ω,τ)=w(ω)hx(ω,τ)(2)

x(ω,τ)=(x1(ω,τ),…,xm(ω,τ))(3)

信号处理部105在上述的式(2)中被适当给出了线性滤波器系数w(ω)的情况下,取得去除了噪音的时频谱y(ω,τ)。这里,线性滤波器系数w(ω)应满足的条件是确保目标声的增益且将干扰声的增益设为0的条件。即,通过该线性滤波器系数w(ω),在目标声的到来方向上形成指向性的基础上,在干扰声的到来方向上形成死角。这与该线性滤波器系数w(ω)满足以下的式(4)及式(5)的情况是等价的。

w(ω)hatrg(ω)=1(4)

w(ω)hadst(ω)=0(5)

上述的式(4)及式(5)能够使用矩阵以式(6)的方式记载。并且,式(6)中的a是以下的式(7)所示的复矩阵,式(6)中的r是以下的式(8)所示的矢量。

ahw(ω)=r(6)

a=(atrg(ω)adst(ω))(7)

r=(10)t(8)

使用以下的式(9)求出满足上述的式(6)的线性滤波器系数w(ω)。

w(ω)=a+r(9)

上述的式(9)中的a+是矩阵a的moore-penrose的伪逆矩阵。信号处理部105使用通过上述的式(9)而求出的线性滤波器系数w(ω),进行上述的式(2)的计算。由此,信号处理部105取得去除了噪音的时频谱y(ω,τ)。信号处理部105对取得的时频谱y(ω,τ)进行离散逆傅里叶变换,重构时间波形并作为最终的输出信号而输出。

外部设备300例如是由扬声器、硬盘或内存等存储介质构成且将从信号处理部105输出的输出信号输出的设备。在外部设备300由扬声器构成的情况下,将输出信号作为声波从该扬声器输出。此外,在外部设备300由硬盘或内存等存储介质构成的情况下,该存储介质将输出信号作为数字数据而存储于硬盘或内存。

接着,说明噪音去除装置100的硬件结构例。

图2a及图2b是示出噪音去除装置100的硬件结构例的图。

噪音去除装置100中的矢量存储部102通过存储器100a来实现。此外,噪音去除装置100中的观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105的各功能通过处理电路来实现。即,噪音去除装置100具备用于实现上述各功能的处理电路。该处理电路可以如图2a所示那样是作为专用的硬件的处理电路100b,也可以如图2b所示那样是执行存储于内存100d的程序的处理器100c。

如图2a所示,在观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105是专用的硬件的情况下,处理电路100b例如相当于单一电路、复合电路、程序化的处理器、并行程序化的处理器、asic(applicationspecificintegratedcircuit)、fpga(field-programmablegatearray)、或者它们的组合。可以由处理电路分别实现观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105的各部的功能,也可以由1个处理电路统一实现各部的功能。

如图2b所示,在观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105为处理器100c的情况下,各部的功能通过软件、固件、或者软件与固件的组合来实现。软件或固件被记述为程序,并存储于内存100d。处理器100c通过读出并执行存储于内存100d的程序,从而实现观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105的各功能。即,具备内存100d,在观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105通过处理器100c而被执行时,该内存100d用于存储结果上执行后述的图3所示的各步骤的程序。此外,这些程序也可以说是使计算机执行观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105的步骤或方法的程序。

这里,处理器100c例如是cpu(centralprocessingunit)、处理装置、运算装置、处理器、微处理器、微型计算机或者dsp(digitalsignalprocessor)等。

内存100d例如可以是ram(randomaccessmemory)、rom(readonlymemory)、闪存、eprom(erasableprogrammablerom)、eeprom(electricallyeprom)等非易失性或易失性的半导体内存,也可以是硬盘、软盘等磁盘,还可以是迷你盘、cd(compactdisc)、dvd(digitalversatiledisc)等光盘。

并且,关于观测信号取得部101、目标声矢量选择部103、干扰声矢量选择部104及信号处理部105的各功能,也可以由专用的硬件实现一部分,由软件或固件实现一部分。这样,噪音去除装置100中的处理电路100b能够通过硬件、软件、固件或者它们的组合来实现上述的各功能。

接着,对噪音去除装置100的动作进行说明。

图3是示出实施方式1的噪音去除装置100的信号处理部105的动作的流程图。

在图3的流程图中,设为在噪音去除装置100进行噪音去除处理的期间,目标声源及噪声源的位置不变化而进行说明。即,在进行噪音去除处理的期间,目标声导向矢量及干扰声导向矢量不变化。

信号处理部105根据目标声矢量选择部103选择出的目标声导向矢量和干扰声矢量选择部104选择出的干扰声导向矢量,求出线性滤波器系数w(ω)(步骤st1)。信号处理部105将从观测信号取得部101输入的观测信号暂时蓄积于存储区域(未图示)(步骤st2)。

信号处理部105进行是否蓄积了规定的长度的观测信号的判定(步骤st3)。在未蓄积规定的长度的观测信号的情况下(步骤st3;否),返回步骤st2的处理。另一方面,在蓄积了规定的长度的观测信号的情况下(步骤st3;是),信号处理部105对蓄积的观测信号进行离散傅里叶变换,求出观测信号矢量x(ω,τ)(步骤st4)。

信号处理部105根据在步骤st1中求出的线性滤波器系数w(ω)和在步骤st4中求出的观测信号矢量x(ω,τ),求出时频谱y(ω,τ)(步骤st5)。信号处理部105对在步骤st5中求出的时频谱y(ω,τ)进行离散逆傅里叶变换,求出时间波形(步骤st6)。信号处理部105将在步骤st6中求出的时间波形作为输出信号输出到外部设备300(步骤st7),结束处理。

如以上那样,根据该实施方式1,构成为具备:目标声矢量选择部103,其从预先取得的、表示声音相对于传感器阵列的到来方向的导向矢量中选择表示目标声的到来方向的目标声导向矢量,其中,该传感器阵列具备2个以上的声学传感器;干扰声矢量选择部104,其从预先取得的导向矢量中选择表示目标声以外的干扰声的到来方向的干扰声导向矢量;以及信号处理部105,其基于从麦克风阵列200得到的2个以上的观测信号、选择出的目标声导向矢量以及选择出的干扰声导向矢量,取得从观测信号去除了干扰声的信号,因此,能够使用目标声的到来方向的导向矢量和干扰声的到来方向的导向矢量的双方,确保目标声的到来方向的声音的增益,并且减少干扰声的到来方向的增益。由此,与仅使用了目标声的到来方向的导向矢量的噪音去除处理进行比较,能够提高目标声的到来方向与干扰声的到来方向接近的情况下的噪音去除性能,能够得到高品质的输出信号。此外,通过提供目标声的到来方向的导向矢量及干扰声的到来方向的导向矢量,无需根据观测信号来进行声源位置的估计,就能够在刚开始噪音去除处理之后得到稳定的噪音去除性能。

此外,根据该实施方式1,信号处理部105构成为通过线性波束成形,取得从观测信号去除了干扰声的信号,其中,该线性波束成形具有将目标声的到来方向设为指向性形成方向且将干扰声的到来方向设为死角形成方向的线性滤波器系数,因此,能够通过线性波束成形而得到低失真的输出信号,能够得到高品质的输出信号。

实施方式2.

在上述的实施方式1中,示出了通过基于线性波束成形的方法来安装信号处理部105的结构,但在该实施方式2中,示出通过基于非线性处理的方法来安装信号处理部105的结构。这里,非线性处理例如是时频掩蔽等。

示出实施方式2的噪音去除装置100的结构的框图与实施方式1相同,因此省略记载。此外,针对实施方式2的噪音去除装置100的构成要素标注与在实施方式1中使用的标号相同的标号来说明。

以下,信号处理部105示出如下结构:基于从观测信号取得部101输入的观测信号和预先测定的存储于矢量存储部102的导向矢量之间的相似度,进行基于时频掩蔽的信号处理。

信号处理部105与实施方式1所示的线性波束成形的处理相同地,将时频谱设为x1(ω,τ)~xm(ω,τ),该时频谱是对通过m个麦克风观测到的观测信号实施离散傅里叶变换而得到的。此时,若声音的稀疏性成立,则信号处理部105如以下的式(10)所示那样,将观测信号除以与第1个麦克风对应的时频谱并进行归一化,由此得到观测信号的导向矢量的估计值

基于上述的式(10)得到的观测信号的导向矢量的估计值在声音的稀疏性完全成立的理想环境下,在时频中的观测信号的频谱为目标声的情况下,与目标声导向矢量atrg(ω)一致,在为干扰声的情况下,与干扰声导向矢量adst(ω)一致。这是因为,通过上述的式(1),目标声导向矢量atrg(ω)及干扰声导向矢量adst(ω)与上述的式(10)中的观测信号同样地被归一化。

因此,信号处理部105基于观测信号的导向矢量的估计值与目标声导向矢量atrg(ω)和干扰声导向矢量adst(ω)中的哪一方一致,能够生成最佳的时频掩码。

但是,实际上,在观测信号的导向矢量的估计值中包括误差。对此,信号处理部105基于观测信号的导向矢量的估计值与目标声导向矢量atrg(ω)和干扰声导向矢量adst(ω)中的哪一方更相似,来生成时频掩码,由此,能够得到稳定的噪音去除性能。信号处理部105计算观测信号的导向矢量的估计值与目标声导向矢量atrg(ω)及干扰声导向矢量adst(ω)的相似度。信号处理部105在计算出的相似度最大的导向矢量为目标声导向矢量atrg(ω)的情况下,使观测信号的时频谱通过。另一方面,信号处理部105在计算出的相似度最大的导向矢量为干扰声导向矢量adst(ω)的情况下,遮断观测信号的时频谱。

具体而言,在将仅使目标声通过的时频掩码设为b(ω,τ)时,信号处理部105如以下的式(11)所示那样基于导向矢量之间的距离,生成时频掩码b(ω,τ)。

根据式(11),时频掩码b(ω,τ)仅使目标声的时频谱通过,将目标声以外的时频谱遮断。

信号处理部105使用该时频掩码b(ω,τ),基于以下的式(12)求出输出信号的时频谱y(ω,τ)。

y(ω,τ)=b(ω,τ)x1(ω,τ)(12)

信号处理部105对得到的时频谱y(ω,τ)进行离散逆傅里叶变换,重构时间波形,生成输出信号。信号处理部105将生成的输出信号输出到外部设备300。

图4是示出实施方式2的噪音去除装置100的信号处理部105的动作的流程图。

作为进行图4的流程图所示的处理的前提,假设在噪音去除装置100进行噪音去除处理的期间,目标声导向矢量及干扰声导向矢量不变化。

并且,以下,针对与实施方式1的噪音去除装置100相同的步骤标注与在图3中使用的标号相同的标号,并省略或简化说明。

信号处理部105将从观测信号取得部101输入的观测信号蓄积于临时存储区域(未图示)(步骤st2)。信号处理部105进行是否蓄积了规定的长度的观测信号的判定(步骤st3)。在未蓄积规定的长度的观测信号的情况下(步骤st3;否),返回步骤st2的处理。另一方面,在蓄积了规定的长度的观测信号的情况下(步骤st3;是),信号处理部105对蓄积的观测信号进行离散傅里叶变换,求出观测信号的时频谱x1(ω,τ)~xm(ω,τ)(步骤st11)。信号处理部105根据在步骤st11中求出的观测信号的时频谱x1(ω,τ)~xm(ω,τ),求出观测信号的导向矢量的估计值(步骤st12)。

信号处理部105基于在步骤st12中求出的观测信号的导向矢量的估计值与目标声导向矢量atrg(ω)之间的距离、以及观测信号的导向矢量的估计值与干扰声导向矢量adst(ω)之间的距离,生成掩码(步骤st13)。详细说明步骤st13的处理的话,信号处理部105在观测信号的导向矢量的估计值与目标声导向矢量atrg(ω)之间的距离比观测信号的导向矢量的估计值与干扰声导向矢量adst(ω)之间的距离小的时频中,生成成为“1”的时频掩码b(ω,τ),在除此以外的时频中,生成成为“0”的时频掩码b(ω,τ)。

信号处理部105根据在步骤st11中求出的观测信号的时频谱x1(ω,τ)和在步骤st13中生成的掩码,求出输出信号的时频谱y(ω,τ)(步骤st14)。信号处理部105对在步骤st14中求出的时频谱y(ω,τ)进行离散逆傅里叶变换,求出时间波形(步骤st6)。信号处理部105将在步骤st6中求出的时间波形作为输出信号而输出到外部设备300(步骤st7),结束处理。

如以上那样,根据该实施方式2,信号处理部105构成为通过使用了遮断干扰声的时频谱的掩码的时频掩蔽,取得从观测信号去除了干扰声的信号,因此,没有同时作为提取或去除对象的导向矢量的数量必须为麦克风的数量以下这样的制约,能够在广泛的状况下利用。此外,能够得到比线性波束成形高的噪音去除性能。

此外,根据该实施方式2,时频掩蔽构成为,根据2个以上的观测信号而估计每个时频的导向矢量,计算该估计出的观测信号的导向矢量与目标声导向矢量及干扰声导向矢量的相似度,在该计算出的相似度最大的导向矢量为目标声导向矢量的情况下,使观测信号的时频谱通过,在计算出的相似度最大的导向矢量不为目标声导向矢量的情况下,遮断观测信号的时频谱,因此,不仅考虑通过麦克风阵列观测的声音的时间差,还同时考虑振幅之差,因此能够生成更高精度的时频掩码。由此,能够得到较高的噪音去除性能。

实施方式1或实施方式2所示的噪音去除装置100能够应用于录音系统、免提通话系统或者声音识别系统等。

首先,针对将实施方式1或实施方式2所示的噪音去除装置100应用于录音系统的情况进行说明。

图5是示出实施方式1或实施方式2的噪音去除装置100的应用例的图。在图5中,示出将噪音去除装置100应用于例如对会议的声音进行录音的录音系统的情况。

如图5所示,噪音去除装置100配置在会议机400之上。会议参加者就座于配置在会议机400的周围的多个椅子500。噪音去除装置100的矢量存储部102预先存储有测定如下的导向矢量而得到的结果,该导向矢量对应于从与噪音去除装置100连接的麦克风阵列200观察到的各椅子500的配置方向。

在单独提取各会议参加者的讲话的情况下,目标声矢量选择部103将与各椅子500的配置方向对应的导向矢量选择为目标声导向矢量。另一方面,干扰声矢量选择部104将与上述的椅子500以外的方向对应的导向矢量选择为干扰声导向矢量。

当会议参加者就座于各椅子500的会议开始时,麦克风阵列200收集各会议参加者的声音,作为观测信号向噪音去除装置100输出。噪音去除装置100的观测信号取得部101将输入的观测信号转换成数字信号并输出到信号处理部105。信号处理部105使用从观测信号取得部101输入的观测信号、目标声矢量选择部103选择出的目标声导向矢量、以及干扰声矢量选择部104选择出的干扰声导向矢量,提取会议参加者的单独的讲话。外部设备300对信号处理部105提取出的会议参加者的单独的讲话的声音信号进行录音。由此,能够使用录音系统,容易地进行例如会议纪要的制作。

另一方面,在仅提取某个会议参加者的讲话的情况下,目标声矢量选择部103将与作为提取讲话的对象的会议参加者的椅子500的配置方向对应的导向矢量选择为目标声导向矢量。另一方面,干扰声矢量选择部104将与上述的某个会议参加者以外的方向对应的导向矢量选择为干扰声导向矢量。

当会议参加者就座于各椅子500而开始会议时,麦克风阵列200收集会议参加者的声音,作为观测信号向噪音去除装置100输出。噪音去除装置100的观测信号取得部101将输入的观测信号转换成数字信号并输出到信号处理部105。信号处理部105使用从观测信号取得部101输入的观测信号、目标声矢量选择部103选择出的目标声导向矢量、以及干扰声矢量选择部104选择出的干扰声导向矢量,仅提取某个会议参加者的讲话。外部设备300对信号处理部105提取出的某个会议参加者的讲话的声音信号进行录音。

如上所述,在讲话者就座于椅子500这样的前提下,通过预先测定与各椅子500的方向对应的导向矢量,从而能够高精度地提取或去除就座于椅子500的讲话者的讲话。

接着,针对将实施方式1或实施方式2所示的噪音去除装置100应用于免提通话系统或声音识别系统的情况进行说明。

图6是示出实施方式1或实施方式2的噪音去除装置100的应用例的图。在图6中,示出将噪音去除装置100应用于车辆内的免提通话系统或声音识别系统的情况。噪音去除装置100例如配置在车辆600的前方,即,相对于驾驶席601及副驾驶席602而配置在车辆600的前方。

车辆600的驾驶员601a就座于驾驶席601。车辆600的其他乘客602a、603a、603b就座于副驾驶席602及后部座席603。噪音去除装置100收集就座于驾驶席601的驾驶员601a的讲话,进行免提通话用的噪音去除处理或者声音识别用的噪音去除处理。为了供驾驶员601a进行免提通话,或者为了进行驾驶员601a的声音的声音识别,需要去除在驾驶员601a的讲话中混入的各种噪音。例如,就座于副驾驶席602的乘客602a的讲话声音成为在驾驶员601a讲话时应去除的噪音。

噪音去除装置100的矢量存储部102预先存储有测定导向矢量而得到的结果,该导向矢量对应于从与噪音去除装置100连接的麦克风阵列200观察到的驾驶席601及副驾驶席602的方向。接着,目标声矢量选择部103在仅提取就座于驾驶席601的驾驶员601a的讲话的情况下,将与驾驶席601的方向对应的导向矢量选择为目标声导向矢量。另一方面,干扰声矢量选择部104将与副驾驶席602的方向对应的导向矢量选择为干扰声导向矢量。

当驾驶员601a及乘客602a讲话时,麦克风阵列200收集驾驶员601a的声音,作为观测信号向噪音去除装置100输出。噪音去除装置100的观测信号取得部101将输入的观测信号转换成数字信号并输出到信号处理部105。信号处理部105使用从观测信号取得部101输入的观测信号、目标声矢量选择部103选择出的目标声导向矢量、以及干扰声矢量选择部104选择出的干扰声导向矢量,提取驾驶员601a的单独的讲话。外部设备300由蓄积信号处理部105提取出的驾驶员601a的单独的讲话的声音信号。免提通话系统或声音识别系统使用蓄积于外部设备300的声音信号,执行声音通话用的处理或者声音识别处理。由此,能够去除就座于副驾驶席602的乘客602a的讲话声音,高精度地仅提取驾驶员601a的讲话,进行声音通话用的处理或者声音识别处理。

并且,在上述中,作为在驾驶员601a讲话时去除的噪音,以就座于副驾驶席602的乘客602a的讲话声音为例进行了说明,但也可以构成为,除了副驾驶席602之外还将就座于后部座席603的乘客603a、603b的讲话声音作为噪音而去除。

如上所述,通过预先测定与车辆600的驾驶席601、副驾驶席602及后部座席603的方向对应的导向矢量,能够高精度地提取就座于驾驶席601的驾驶员601a的讲话。由此,在免提通话系统中能够提高通话音质。此外,在声音识别系统中,在存在噪音的状况下,也能够高精度地识别驾驶员的讲话。

在上述以外,本发明也能够在该发明的范围内进行各实施方式的自由组合、各实施方式的任意的结构要素的变形、或者各实施方式的任意的结构要素的省略。

产业利用性

本发明的噪音去除装置是在产生目标声以外的噪音的环境下使用的设备,能够应用于用于仅收集目标声的录音装置、通话装置或者声音识别装置等。

标号说明

100噪音去除装置,101观测信号取得部,102矢量存储部,103目标声矢量选择部,104干扰声矢量选择部,105信号处理部。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1