声源分离装置、声源分离方法、以及程序的制作方法

文档序号:2832747阅读:259来源:国知局
专利名称:声源分离装置、声源分离方法、以及程序的制作方法
技术领域
本发明涉及一种使用多个麦克风从多个声源所发出的多个声音信号、各种环境噪声等多个音响信号混杂的信号中分离出来自目标声源的声源信号的声源分离装置、声源分离方法、以及程序。
背景技术
想要在各种环境下收录特定的声音信号等的情况下,由于周围环境中存在有各种各样的噪声源,所以用麦克风仅收录作为目标声音的信号是比较困难的,需要进行一些噪声降低处理或者声源分离处理。作为尤其需要这些处理的实例,举例有在汽车环境下。在汽车环境下,由于移动电话的普及,行驶中的使用移动电话的通话一般采用与车内分开设置的麦克风,从而使得通话品质显著变差。又,由于在汽车环境下在行驶中进行声音识别的情况下也在相同的状况下发声,这成为使得声音识别性能变差的原因。由于现在的声音识别技术的进步,对于相对于稳态噪声的声音识别率变差的问题,能够恢复变差了的性能的相当大的部分。但是,作为以现有的声音识别技术难以对应的问题,有多个发声者同时发声时的识别性能变差的问题。采用现有的声音识别技术的话,由于识别同时发声的二个人的混合音的技术较低,因此在声音识别装置使用时会限制发声者以外的同乘者发声,发生限制同乘者的行动的状况。又,关于移动电话、或者能够与移动电话连接进行免提通话的头戴送受话器,在背景噪声环境下进行通话时也同样会发生通话品质的变差。作为解决上述那样的问题的方法,存在有具有多个麦克风的声源分离方法。例如,专利文献I所记载的声源分离装置进行波束形成处理,以使得来自相对于连接两个麦克风的直线的垂线对称的方向的声源信号分别衰减,根据对波束形成输出计算出的功率谱信息之间的差值提取目标声源的频谱信息。通过采用专利文献I所记载的声源分离装置,能够实现指向特性不受麦克风元件的灵敏度影响的性质,能够不受麦克风元件的灵敏度的差异的影响地从混合有多个声源所发出的声源信号的混合音之中分离来自目标声源的声源信号。现有技术文献专利文献专利文献1:日本专利第4225430号公报非专利文献非专利文献1:Y.Ephraim And D.Malah, 〃利用最小均方误差短时谱幅度估计的语音增强算法(Speech enhancement using minimum mean-square error short-timespectral amplitude estimator) 〃,IEEE Trans Acoust., Speech, Signal Processing, ASSP-32, 6,pp.1109-1121,Dec.1984.
非专利文献2:S.Gustafsson, P.Jax, And P.Vary, 〃保留背景噪声特征的新型的基于心理声学模型的音频增强算法(A novel psychoacoustically motivated audioenhancement algorithm preserving background noise characteristics), ^IEEEInternational Conference On Acoustics, Speech And Signal Processing, ICASSP' 98, vol.1,ppt.397-400vol.1, 12_15May 1998.

发明内容
发明要解决的课题然而,采用专利文献I所记载的声源分离装置的话,在波束形成处理后所计算出的两个功率谱信息的差值为规定的阈值以上的情况下,将该差值识别为目标声音就照原样进行输出,另一方面,在两个功率谱信息的差值小于规定的阈值的情况下,该差值被识别为噪声并将该频带的输出设为O。因此,在存在例如如汽车的行驶噪声那样到来方向没规定为特定的方向的扩散性噪声的环境下,使得专利文献I的声源分离装置动作时,特定的频带被大大地删除,结果存在扩散性噪声被不规则地分配给声源分离结果而变成音乐噪声的(音乐噪声)的情况。另外,音乐噪声是指噪声的去除残留,由于是在时间轴上以及频率轴上孤立的成分,因此其作为不自然的刺耳的声音而被听到。又,在专利文献I中,揭示了通过将后置滤波处理放在波束形成处理的前段,来降低扩散性噪声、稳态噪声等,从而防止声源分离后的音乐噪声发生的技术。然而,在麦克风分开配置的情况下、麦克风被模铸在移动电话、头戴送受话器等的框体上的情况下,被输入两个麦克风的噪声的音量差、相位差变大。因此,如果将由其中一个麦克风求得的增益就这样适用于另一个麦克风的话,目标声音在每个频带都被压制、或者噪声大大残留。其结果,难以充分地防止音乐噪声的发生。因此,本发明正是为了解决上述那样的问题而做出的,其目的在于提供能够不受麦克风的配置的影响地使音乐噪声的发生充分地降低的声源分离装置、声源分离方法、以及程序。解决课题的手段为了解决上述课题,本发明的一个形态为从混合有多个声源所发出的声源信号的混合音中分离来自目标声源 的声源信号的声源分离装置,其特征在于,包括:第I波束形成处理部,其通过对来自由被输入所述混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含所述目标声源的方向的区域相反的区域到来的声源信号衰减;第2波束形成处理部,其通过对来自所述麦克风对的各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系;功率计算部,其根据通过所述第I波束形成处理部得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2波束形成处理部得到的信号计算具有每个频率的功率值的第2频谱信息;加权系数算出部,其根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I波束形成处理部所得到的信号相乘的每个频率的加权系数,所述声源分离装置根据由所述第I波束形成处理部得到的信号与所述加权系数算出部所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
又,本发明的其他的形态为一种声源分离方法,其由具有第I波束形成处理部、第2波束形成处理部、功率计算部、加权系数算出部和声源分离部的声源分离装置所执行,其特征在于,包括以下步骤第1步骤,在该步骤中,所述第I波束形成处理部通过对来自由被输入混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含目标声源的方向的区域相反的区域到来的声源信号衰减,所述混合音混合有多个声源所发出的声源信号;第2步骤,在该步骤中,所述第2波束形成处理部通过对来自所述麦克风对的各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系;第3步骤,在该步骤中,所述功率计算部根据通过所述第I步骤得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2步骤得到的信号计算具有每个频率的功率值的第2频谱信息;第4步骤,在该步骤中,所述加权系数算出部根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I步骤所得到的信号相乘的每个频率的加权系数,所述声源分离方法根据由所述第I步骤得到的信号与所述第4步骤所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。又,本发明的其他的形态为一种声源分离程序,其特征在于,使得计算机执行以下的步骤:第I处理步骤,在该步骤中,通过对来自被输入混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含目标声源的方向的区域相反的区域到来的声源信号衰减,所述混合音混合有多个声源所发出的声源信号;第2处理步骤,在该步骤中,通过对来自所述麦克风对各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系;第3处理步骤,在该步骤中,根据通过所述第I处理步骤得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2处理步骤得到的信号计算具有每个频率的功率值的第2频谱信息;第4处理步骤,在该步骤中,根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I步骤所得到的信号相乘的每个频率的加权系数,所述声源分离程序根据由所述第1处理步骤得到的信号与所述第4处理步骤所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。采用这样的构成,尤其是在存在扩散性噪声的环境下也能够抑制音乐噪声的发生、且能够从混合有多个声源所发出的声源信号的混合音当中分离来自目标声源的声源信号。发明的效果能够维持专利文献1的效果,且使得音乐噪声的发生充分地降低。


图1是示出第1实施形态所涉及的声源分离系统的构成的图。图2是示出第1实施形态所涉及的波束形成部的构成的图。图3是示出功率计算部的构成的图。
图4是示出相对于麦克风输入信号的、专利文献I所涉及的声源分离装置和本发明的第I实施形态所涉及的声源分离装置中的处理结果的图。图5是示出图4的处理结果的一部分的放大图。图6是示出噪声推定部的构成的图。图7是示出噪声均衡部的构成的图。图8是示出第I实施形态所涉及的声源分离系统的另一构成的图。图9是示出第2实施形态所涉及的声源分离系统的构成的图。图10是示出控制部的构成的图。图11是示出第3实施形态所涉及的声源分离系统的构成的一例的图。图12是示出第3实施形态所涉及的声源分离系统的构成的一例的图。图13是示出第3实施形态所涉及的声源分离系统的构成的一例的图。图14是示出第4实施形态所涉及的声源分离系统的构成的图。图15是示出指向性控制部的构成的图。图16是示出本发明的声源分离装置的指向特性的图。图17是示出指向性控制部的另一构成的图。图18是示出设置有目标声音修正部的情况下本发明的声源分离装置的指向特性的图。图19是示出声源分离系统的处理的一例的流程图。图20是示出噪声推定部的处理的详细情况的流程图。图21是示出噪声均衡部的处理的详细情况的流程图。图22是示出残留噪声压制算出部的处理的详细情况的流程图。图23是示出就波束形成器30的输出值对邻近声音和远距离声音的情况进行比较的图表的图(麦克风间隔3cm)。图24是示出就波束形成器30的输出值对邻近声音和远距离声音的情况进行比较的图表的图(麦克风间隔1cm)。图25是示出专利文献I的声源分离装置的声源分离的边界面的图。图26是示出专利文献I的声源分离装置的指向特性的图。
具体实施例方式以下,参照附图对本发明所涉及的实施形态进行说明。[第I实施形态]图1是第I实施形态所涉及的声源分离系统的基本的构成的图。该系统包括两个麦克风(以下称为「麦克风」)10、11,和声源分离装置I。以下,设麦克风为两个来对实施形态进行说明,但麦克风的数量可以是至少两个以上,并不限定于两个。该声源分离装置I具有:包含未图示的、对整体进行控制并执行运算处理的CPU以及ROM、RAM、硬盘装置等的存储装置的硬件;和包含存储在存储装置中的程序、数据等的软件。通过这些硬件以及软件来实现声源分离装置I的各功能模块。两个麦克风10、11在平面上相互分开地设置,接收从两个声源Rl、R2发出的信号。此时,使得这两个声源Rl、R2分别位于以与连接两个麦克风10、11的线段相交的平面(以下、设为分离面)为边界而分割的两个区域(以下称为「分离面的左右」),但未必需要存在于相对于分离面左右对称的位置。另外,在本实施形态中,对将分离面设为与在面内含有连接两个麦克风10、11的线段的平面垂直相交、且通过所述线段的中点的平面的实例进行说明。又,设从声源Rl发出的声音为应取得的目标声音,从声源R2发出的声音为应压制的噪声(本说明书通篇都是同样的)。又,噪声并不限定于一个,也可以是多个。不过,使得目标声音与噪声的方向不同。在频谱分析部20、21中,就每一个麦克风输出对由该麦克风10、11得到的两个声源信号分别进行频率分析,在波束形成部3中通过波束形成器30、31对这些被频率分析了的信号进行过滤,该波束形成器30、31在分离面的左右形成了死角,在功率计算部40、41中计算其过滤输出的功率进行计算。另外,波束形成器30、31优选为,在分离面的左右相对于分离面对称地形成死角。[波束形成部]首先,参照图2对由波束形成器30、31形成的波束形成部3的构成进行说明。将由频谱分析部20、频谱分析部21就每个频率成分进行分解得到的信号X1 ( )、x2 ( )作为输入,通过乘法器100a、100b、100c、IOOd,分别进行与滤波系数W1 ( co )、w2 ( to) ^w1* (W)、w; ( CO ) (*表示存在复共轭的关系)的乘法运算。而且,通过加法器100e、IOOf将两个乘法结果相加,输出滤波处理结果dsi (O)、ClS2 (CO)作为其输出。设相对于目的方位91的增益为1,在其他方向02形成一个死角(增益0)的波束形成器30的滤波矢量(7 4卟夕卜卟)为W1 ( to,0 17 0 2) = [Wi ( O,Q1, 0 2), W2 ( W , Q1, 0 2)] T、观测信号为 X ( W,Q1, 0 2) = [X1 ( O,Q1, 0 2),X2 ( W,Q1, e2)] T的时候,波束形成器3 0的输出dSl (CO)可以由下式求出。其中,T表示转置操作,H表示共轭转置操作。[数式I]Cls1(Co) = W1 ( Co , 0 1; 9 2) hX ( Co , 0 1; 0 2) (I)又,设波束形成器31的滤波矢量为W2 ( ,9 9 2) = [W1* (* ,9 9 2), W2*(O,0 1; 0 2)] T时,波束形成器31的输出ds2 (W)可以由下式求出。[数式2]ds2(co) = W2 ( co , 0 17 0 2) hX (to , O1, 0 2) ⑵这样,波束形成部3通过使用复共轭滤波系数,在相对于分离面对称的位置形成死角。在此,《表示角频率,相对于频率存在f = 2 Jif的关系。[功率计算部]接着,参照图3对功率计算部40、41进行说明。功率计算部40、41通过以下的计算式将来自波束形成器30、波束形成器31的输出dSl ( co )、ds2 ( co )转换为功率谱信息psi
(W )、PS2 ( W )。[数式3]PS1(W) = [Re (ds: (w)) ]2+ [Im(ds: (w)) ]2 (3)[数式4]ps2 (co) = [Re (ds2 (co)) ]2+[Im(ds2 (co)) ]2 (4)
[加权系数算出部]功率计算部40、41的输出Ps1 ( co )、ps2 ( co )被用作加权系数算出部50的两个输入。加权系数算出部50将该两个波束形成器30、31的输出的功率谱信息作为输入,输出每个频率的加权系数Gbsa ( o )。加权系数Gbsa ( o )是基于所述功率谱信息彼此间的差值的值,作为加权系数Gbsa( )的一例,考虑到有以以下的值作为定义域的单调增加函数的输出值,其中作为该定义域的值是,对每个频率计算PSi ( CO )与PS2 (W)的差值,在PSi (CO)的值比PS2 (CO)的值大的情况下表示PS1 (CO)与PS2 ( )的差值的平方根除以PS1 ( )的平方根所得到的值,在PS1 ( )的值为PS2 ( )以下的值的情况下表示0的值。用数式表示加权系数Gbsa( )时,如下所示。[数式5]
权利要求
1.种声源分离装置,其从混合有多个声源所发出的声源信号的混合音中分离来自目标声源的声源信号,其特征在于,包括: 第I波束形成处理部,其通过对来自由被输入所述混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含所述目标声源的方向的区域相反的区域到来的声源信号衰减; 第2波束形成处理部,其通过对来自所述麦克风对的各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系; 功率计算部,其根据通过所述第I波束形成处理部得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2波束形成处理部得到的信号计算具有每个频率的功率值的第2频谱信息;以及加权系数算出部,其根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I波束形成处理部所得到的信号相乘的每个频率的加权系数;所述声源分离装置具有声源分离部,其根据由所述第I波束形成处理部得到的信号与所述加权系数算出部所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
2.权利要求1所述的声源分离装置,其特征在于,还具有, 使得由所述第I波束形成处理部得到的信号与所述加权系数算出部所算出的所述加权系数相乘的加权系数乘法部, 所述声源分离部根据以 规定的比例对所述加权系数乘法部的输出结果和从所述第I波束形成处理部得到的信号进行相加后的结果,从所述混合音分离来自所述目标声源的声源信号。
3.权利要求2所述的声源分离装置,其特征在于,具有: 音乐噪声降低部,其输出以规定的比例对所述加权系数乘法部的输出结果和从所述第I波束形成处理部得到的信号进行相加后的结果, 噪声推定部,其通过对来自所述麦克风对中靠近所述目标声源的麦克风的输出信号应用滤波系数可变的自适应滤波器,计算出与来自所述麦克风对中远离所述目标声源的麦克风的输出信号一致的模拟信号,根据来自远离所述目标声源的麦克风的输出信号与所述模拟信号的差值计算出噪声成分; 噪声均衡部,其根据所述音乐噪声降低部的输出结果和所述噪声推定部所算出的所述噪声成分,计算出所述音乐噪声降低部的输出结果中所包含的噪声成分;以及 残留噪声压制部,其根据所述音乐噪声降低部的输出结果和噪声均衡部的输出结果压制所述音乐噪声降低部的输出结果中所包含的残留噪声, 所述声源分离部根据所述残留噪声压制部的输出结果从所述混合音中分离来自所述目标声源的声源信号。
4.权利要求3所述的声源分离装置,其特征在于,具有控制部,所述控制部根据所述每个频率的加权系数对所述噪声推定部、所述噪声均衡部、以及所述残留噪声抑制部中的至少一个进行控制。
5.权利要求1所述的声源分离装置,其特征在于,具有, 音乐噪声降低增益算出部,所述音乐噪声降低增益算出部计算出用于以规定的比例对由所述第I波束形成处理部得到的声源信号乘以所述加权系数后的乘法运算结果和由所述第I波束形成处理部得到的声源信号进行相加的增益, 所述声源分离部根据所述音乐噪声降低增益算出部所算出的增益与由所述第I波束形成处理部得到的声源信号的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
6.权利要求5所述的声源分离装置,其特征在于,具有, 噪声推定部,其通过对来自所述麦克风对中靠近所述目标声源的麦克风的输出信号应用滤波系数可变的自适应滤波器,计算出与来自所述麦克风对中远离所述目标声源的麦克风的输出信号一致的模拟信号,根据来自远离所述目标声源的麦克风的输出信号与所述模拟信号的差值计算出噪声成分; 噪声均衡部,其根据由所述第I波束形成处理部得到的声源信号与在所述音乐噪声降低增益算出部算出的增益相乘后的乘法运算结果、和所述噪声推定部所算出的所述噪声成分,计算出由所述第I波束形成处理部得到的声源信号与在所述音乐噪声降低增益算出部中被算出的增益相乘后的乘法运算结果中所包含的噪声成分;以及 残留噪声压制增益算出部,其根据由所述音乐噪声降低增益算出部算出的增益和由所述噪声均衡部所算出的所述噪声 成分,计算出用于与由所述第I波束形成处理部得到的声源信号相乘的增益,该增益是用于对由所述第I波束形成处理部得到的声源信号与在所述音乐噪声降低增益算出部中被算出的增益相乘后的乘法运算结果中所包含的残留噪声进行压制的增益, 所述声源分离部根据由残留噪声压制增益算出部所算出的增益与由所述第I波束形成处理部得到的声源信号的乘法运算结果从所述混合音分离来自所述目标声源的声源信号。
7.权利要求6所述的声源分离装置,其特征在于,具有控制部,所述控制部根据所述每个频率的加权系数对所述噪声推定部、所述噪声均衡部、以及所述残留噪声压制增益算出部中的至少一个进行控制。
8.权利要求1至7中任一项所述的声源分离装置,其特征在于,具有基准延迟量算出部和指向性控制部,所述基准延迟量算出部对于每个频率计算出基准延迟量,所述基准延迟量用于与来自所述麦克风对的至少一方的麦克风的输出信号相乘以使得该麦克风的位置假想地移动,所述指向性控制部就每个频带对来自所述麦克风对的至少一方的麦克风的输出信号赋予延迟量, 所述指向性控制部在基准延迟量算出部所算出的所述基准延迟量满足空间采样定理的频带中,将该基准延迟量作为所述延迟量,在所述基准延迟量不满足空间采样定理的频带中,将通过下述式子(30)求得的最佳延迟量T 0作为所述延迟量, [数I] ,.c % d 十 To * C =-CO
9.种声源分离装置,其从混合有多个声源所发出的声源信号的混合音中分离来自目标声源的声源信号,其特征在于,包括: 第I波束形成处理单元,其通过对来自由被输入所述混合音的两个麦克风构成的麦克风对的各自的输出信号乘以不同的第I系数,对所得到的结果在频域进行积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含所述目标声源的方向的区域相反的区域到来的声源信号衰减; 第2波束形成处理单元,其通过对所述麦克风对的各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述不同的第I系数在频域为复共轭的关系; 功率计算单元,其根据通过所述第I波束形成处理单元得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2波束形成处理单元得到的信号计算具有每个频率的功率值的第2频谱信息;以及 加权系数算出单元,其根 据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I波束形成处理单元所得到的信号相乘的每个频率的加权系数; 所述声源分离装置具有声源分离单元,其根据由所述第I波束形成处理单元得到的信号与所述加权系数算出单元所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
10.权利要求9所述的声源分离装置,其特征在于, 还具有使得由所述第I波束形成处理单元得到的信号与所述加权系数算出单元所算出的所述加权系数相乘的加权系数乘法单元, 所述声源分离单元根据以规定的比例对所述加权系数乘法单元的输出结果和从所述第I波束形成处理单元得到的信号进行相加后的结果,从所述混合音分离来自所述目标声源的声源信号。
11.种声源分离方法,其由具有第I波束形成处理部、第2波束形成处理部、功率计算部、加权系数算出部和声源分离部的声源分离装置所执行,其特征在于,包括以下步骤: 第I步骤,在该步骤中,所述第I波束形成处理部通过对来自由被输入混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含目标声源的方向的区域相反的区域到来的声源信号衰减,所述混合音混合有多个声源所发出的声源信号; 第2步骤,在该步骤中,所述第2波束形成处理部通过对来自所述麦克风对的各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系; 第3步骤,在该步骤中,所述功率计算部根据通过所述第I步骤得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2步骤得到的信号计算具有每个频率的功率值的第2频谱信息; 第4步骤,在该步骤中,所述加权系数算出部根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所述第I步骤所得到的信号相乘的每个频率的加权系数;以及 第5步骤,在该步骤中,所述声源分离部根据由所述第I步骤得到的信号与所述第4步骤所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
12.种程序,其特征在于,使得计算机执行以下的步骤: 第I处理步骤,在该步骤中,通过对来自被输入混合音的两个麦克风构成的麦克风对的各自的输出信号进行使用了相互不同的第I系数的、在频域的积和运算,以与连接所述两个麦克风的线段相交的平面为界限,使得从与包含目标声源的方向的区域相反的区域到来的声源信号衰减,所述混合音混合有多个声源所发出的声源信号; 第2处理步骤,在该步骤中,通过对来自所述麦克风对各自的输出信号乘以第2系数,对所得到的结果在频域进行积和运算,以所述平面为界限使得从包含所述目标声源的方向的区域到来的声源信号衰减,所述第2系数与所述相互不同的第I系数在频域为复共轭的关系; 第3处理步骤,在该步骤中,根据通过所述第I处理步骤得到的信号计算具有每个频率的功率值的第I频谱信息,进一步地根据通过所述第2处理步骤得到的信号计算具有每个频率的功率值的第2频谱信息;第4处理步骤,在该步骤中,根据所述第I频谱信息与所述第2频谱信息的每个频率的功率值的差值,计算用于与所 述第I步骤所得到的信号相乘的每个频率的加权系数;以及第5处理步骤,在该步骤中,所述声源分离部根据由所述第I处理步骤得到的信号与所述第4处理步骤所算出的所述加权系数的乘法运算结果,从所述混合音分离来自所述目标声源的声源信号。
全文摘要
本发明提供声源分离装置、声源分离方法、以及程序。采用现有的声源分离装置的话,在存在到来方向没规定为特定的方向的扩散性噪声的环境下,特定的频带被大大地删除,结果存在扩散性噪声被不规则地分配给声源分离结果而变成音乐噪声的情况。因此,本发明的一个形态中,声源分离装置(1)的波束形成部(3)通过对频谱分析后的来自麦克风(10、11)的输出信号乘以存在复共轭的关系的加权系数,进行波束形成处理,以与连接两个麦克风(10、11)的线段相交的平面为界限,使得从包含目标声源的大致方向的区域以及与该区域相反的区域到来的各声源信号衰减。加权系数算出部(50)根据由功率计算器(40、41)所计算出的功率频谱信息之间的差值,计算加权系数。
文档编号G10L21/02GK103098132SQ201180019738
公开日2013年5月8日 申请日期2011年8月25日 优先权日2010年8月25日
发明者松井信也, 石川洋儿, 长滨克昌 申请人:旭化成株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1