基于分布式麦克风阵列网络的语音增强方法_3

文档序号:9454226阅读:来源:国知局
果的差异,使得算法输出并不完全一致。此外,两个变 换域算法还存在计算复杂度的差异。
[0124] 图4是基于多通道维纳滤波器的单节点语音增强的流程图。如图4所示:首先要 对语音活动进行检测或者对语音存在概率进行估计,其次对噪音自相关矩阵进行估计,再 次对噪音自相关矩阵进行计算,最后进行多通道维纳滤波器的计算。
[0125] 使用时域或频域的多通道维纳滤波器对原始多路信号进行滤波的方法如下:
[0126] 在节点K,所述时域多通道维纳滤波器的表达式为:
[0127] hw>K(t) = [Rxx,K(t) +ARnn>K(t)] 1Rxx>K(t)u;
[0128] 上式中,Rxx, K (t) = Ryy, K (t) _Rnn, K (t);
[0129] Rn反⑴=五⑷]?,是当前节点的纯净语音向量x K(t)= [xliK(t), x2,K(t),? ? ?,xM,K(t)]T的时域自相关矩阵;
[0130] 作)=五{"A'GMrO},是当前节点的噪声向量 nK(t) = [nliK(t),n2,K(t),? ? ?,n M,K(t)]T的时域自相关矩阵;
[0131](f)= £|~(咖沐)丨,是当前节点的多路麦克风阵列观测信号向量yK (t)=
[yi,K(t),y2,K(t),...,yM,K(t)]T的时域自相关矩阵;
[0132] u = [1,0, ? ? ?,0]T,其长度为 M;
[0133] M为当前节点的麦克风数量;
[0134] A为控制噪声消除和语音畸变的程度,A >〇,当A越大,噪声被抑制的效果越 明显,同时带来更多的语音畸变;
[0135] 节点K的时域滤波输出为歹贫的=11财51^(你咏(场
[0136] 在节点K,所述频域多通道维纳滤波器的表达式为:
[0137]HWjK(〇)=[Rxx>k(o)+ARnn>k(o)] 1Rxx>k(o)u;
[0138]上式,RXX,K(?) =RYY,K(?)-RNN,K(?);
[0139] 二'芯{Xi^(W)Xf (U)},是当前节点的纯净语音向量XK(?) = [XL JohXwh),...,XM,K(co)]%频域自相关矩阵;
[0140] 况a:{?)〇)},是当前节点的噪声向量Nk(w) = [\k(w),N2,k(?), ???,Nm,k(co)]h的频域自相关矩阵;
[0141] R.n: /、、(^ )= ⑷〇)丨,是当前节点的多路麦克风阵列观测信号向量yk (?) =的频域自相关矩阵;
[0142] u = [1,0, ? ? ?,0]T,其长度为 M;
[0143] M为当前节点的麦克风数量;
[0144] A为控制噪声消除和语音畸变的程度,A >〇,A越大,噪声被抑制的效果越明 显,同时带来更多的语音畸变;
[0145] 节点K的频域滤波输出为
[0146] 当节点只包含一个麦克风时,节点输出的单通道增强后语音信号为原始观测信 号。
[0147] 多通道维纳滤波器的关键问题是噪声自相关矩阵的估计。在时域上,该矩阵可结 合语音活动检测进行估计。假设当前帧被判断为噪音,则
[0148]
[0149] 上式中,0 < a > 1为更新因子。否则,保持该矩阵不更新。类似地,在频域上,可 结合语音存在概率进行估计。假设当前帧频带《的语音存在概率为p(?),则R NN,K(?)更 新为:
[0150] RNN,K(o)-a pRNN,K(o)+(l-a p)X(〇)XH(〇);
[0151] 其中,a p= a+p(?) (1-a ),同样地〇 < a < 1为更新因子。时域或频域的噪 声自相关矩阵初始化为初始若干帧内矩阵的平均值。
[0152] 当节点只包含一个麦克风时,为了避免本节点增强后的语音信号畸变,该节点输 出的单通道增强后语音信号为原始多路麦克风阵列观测信号。
[0153](3)、基于多通道维纳滤波器的多节点迭代式语音增强。
[0154] 步骤e、在每个节点,将该节点通过所述步骤d得到的单通道增强后语音信号传输 到网络的所有其他节点。步骤e中,在信号传输的数据包中还可加入发射节点、接收节点序 号和多通道维纳滤波器处理次数等信息,以和其他数据包相互区别。
[0155] 步骤f、在每个节点,同时根据当前节点的麦克风阵列的多路观测信号和所有其他 节点的单通道增强后语音信号,再次采用多通道维纳滤波器进行语音增强,得到当前节点 更新后的单通道增强后语音信号;
[0156] 每个节点均可根据节点自身的麦克风阵列观测信号得到单通道增强后的语音信 号。不同节点增强后的语音信号一方面抑制了该节点周围的噪声,另一方面提供了纯净语 音的冗余信息,因此可被其他节点用于进一步提高语音增强的效果。从网络通信的角度出 发,传输增强后的单通道语音信号,而非节点所观测到的多通道原始信号,极大节省了带 宽,并保证了节点间数据传输格式的一致性。
[0157] 本环节将其余节点的增强后单通道语音信号和本节点的多通道观测信号一起构 成新的观测向量。在其余节点增强后单通道语音信号可被视作本地节点新的观测通道,类 似地,可以采用多通道维纳滤波器,根据上述新的观测向量,得到更新后的本节点增强后单 通道语音信号。
[0158] 步骤g、重复迭代步骤e~步骤f,当某节点得到的单通道增强后语音信号收敛时, 当前节点的单通道增强后语音信号不再更新;当所有节点的单通道增强后语音信号均不再 更新时,当前帧处理结束;最终在每个节点均得到当前节点增强后语音信号。
[0159] 图5是基于多通道维纳滤波器的多节点迭代式语音增强的流程图。首先构造当前 节点的多路观测信号和所有其他节点的增强后信号所构成的联合向量,其次对语音活动进 行检测或者对语音存在概率进行估计,再次更新噪声自相关矩阵,之后计算带噪音信号的 自相关矩阵,最后进行多通道维纳滤波器的计算。
[0160] 具体计算方法如下:
[0161] 在节点K,所述时域的多通道维纳滤波器中,
[0162]当前节点K多路观测信号和所有其他节点的增强后信号所构成的联合向量为
为除节点K外其他节点增强后的时域单通道语音所组成的向量:
[0164]队为步骤g的迭代次数;
[0165]爱政的是夕友?中的纯净语音成分;
[0166] 是歹瓦:⑷中的噪声成分;
[0167] 良心(t)=忍伊裏⑷綠⑷},为当前节点中纯净语音成分交欠⑷的时域自相 关矩阵;
[0168] 为当前节点中噪声成分fiA-⑷的时域自相关矩阵;
[0169] 食为当前节点中联合向量5^.⑴的时域自相关矩阵;
[0170]
[0171] u= [1,0,...,0]1,其长度为1?3-1,?为网络中的节点总数;
[0172] 则节点K第队+1次迭代的时域多通道维纳滤波器为:
[0173]
[0174] 在节点K,所述频域的多通道维纳滤波器中,
[0175]当前节点K多路观测信号和所有其他节点的增强后信号所构成的联合向量为
[0176]上式中,Y取谀(W) = [7勒眺?...yF'氣戌-顧-+? K外其他节点增强后的频域单通道语音所组成的向量;
[0177]队为步骤g的迭代次数;
[0178] 袁%贫(0;)为联合向量中的纯净语音成分;
[0179] 食為#(0;)为联合向量兮况,反(〇;)中的噪声成分;
[0180]
为除去节点K之外其他节点的纯净语音向量的频域自相关矩阵;
[0181] R,;v-五?为除去节点K之外其他节点背景噪首向量的 频域自相关矩阵;
[0182] Rnyvj卜;)=五^以为除去节点K之外其他节点观测向量的频域 自相关矩阵;
[0183]
[0184] u = [1,0, ...,0]T;其长度为M+P-l,P为网络中的节点总数,则节点1(第^+1次 迭代的颇域名诵道維纳滤被器为,
[0185]
[0186] 当所有节点得到更新后的单通道语音增强信号之后,同样可以将此更新后的信号 传输至其他节点,以便于其他节点再次更新单通道语音增强信号。因此,可以在分布式麦克 风阵列网络重复上述步骤,当某节点得到的单通道增强后语音信号收敛时,增强后语音信 号不再更新。当所有节点单通道语音信号均不再更新时,当前帧处理结束,最终在每个节点 均得到当前节点增强后语音信号。
[0187] 步骤g还可包括判断语音信号是否收敛的步骤。我们可以根据滤波前后信号向量 之差的范数,以及信号能量综合判断某节点得到的单通道增强后语音信号是否收敛:步骤 g根据滤波前后信号向量之差的范数,以及信号能量综合判断某节点得到的单通道增强后 语音信号是否收敛,其方法如下:
[0188] 在节点K,前次滤波得到的单通道时域信号向量是
[0189]
[0190] 本次
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1