一种基于语音信号构造聚焦协方差矩阵的方法及装置的制造方法

文档序号:8283477阅读:324来源:国知局
一种基于语音信号构造聚焦协方差矩阵的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及语音信号处理技术领域,特别涉及一种基于语音信号构造聚焦协方差 矩阵的方法及装置。
【背景技术】
[0002] 麦克风阵列与单麦克风相比,除了能利用声源的时域和频域信息外,还能利用声 源的空间信息,因此,具有抗干扰能力强、应用灵活等优点,在解决声源定位、语音增强、语 音识别等问题方面具有较强的优势,目前已广泛用于音视频会议系统、车载系统、助听装 置、人机交互系统、机器人系统、安防监控、军事侦察等领域。
[0003] 在基于麦克风阵列的语音处理技术中,往往需要知道声源的数目,这样才能获得 较高的处理性能;如果声源数目未知,或者假设的声源数目过多或过少,则对麦克风阵列获 取的语音的处理结果的准确性就会下降。
[0004] 为了提高对麦克风阵列获取的语音的处理结果的准确度,提出了计算声源的方 法,在计算声源的过程中,需要构造聚焦协方差矩阵,但是,目前在构造聚焦协方差矩阵的 过程中需要预测声源的入射角度,再根据预测的入射角度构造聚焦协方差矩阵,并估算声 源的数目,但是,如果预测出的声源的入射角度误差较大的话,构造得到的聚焦协方差矩阵 的准确度较低。

【发明内容】

[0005] 本发明实施例提供一种基于语音信号构造聚焦协方差矩阵的方法及装置,用以解 决现有技术中存在的构造得到的聚焦协方差矩阵的准确度较低的缺陷。
[0006] 本发明实施例提供的具体技术方案如下:
[0007] 第一方面,提供一种基于语音信号构造聚焦协方差矩阵的方法,包括:
[0008] 确定麦克风阵列采集语音信号时采用的采样频点;
[0009] 针对确定出的采样频点中的任意一个采样频点,计算在所述任意一个采样频点采 集到的语音信号的第一协方差矩阵、聚焦变换矩阵,及所述聚焦变换矩阵的共轭转置矩阵, 并将所述第一协方差矩阵、所述聚焦变换矩阵、所述聚焦变换矩阵的共轭转置矩阵的乘积, 作为在所述任意一采样频点采集到的语音信号的聚焦协方差矩阵;
[0010] 将计算得到的在各个采样频点分别采集得到的语音信号的聚焦协方差矩阵之和, 作为所述麦克风阵列采集到的语音信号的聚焦协方差矩阵。
[0011] 结合第一方面,在第一种可能的实现方式中,计算所述第一协方差矩阵,具体包 括:
[0012] 采用如下方式计算所述第一协方差矩阵:
【主权项】
1. 一种基于语音信号构造聚焦协方差矩阵的方法,其特征在于,包括: 确定麦克风阵列采集语音信号时采用的采样频点; 针对确定出的采样频点中的任意一个采样频点,计算在所述任意一个采样频点采集到 的语音信号的第一协方差矩阵、聚焦变换矩阵,及所述聚焦变换矩阵的共辆转置矩阵,并将 所述第一协方差矩阵、所述聚焦变换矩阵、所述聚焦变换矩阵的共辆转置矩阵的乘积,作为 在所述任意一采样频点采集到的语音信号的聚焦协方差矩阵; 将计算得到的在各个采样频点分别采集得到的语音信号的聚焦协方差矩阵之和,作为 所述麦克风阵列采集到的语音信号的聚焦协方差矩阵。
2. 如权利要求1所述的方法,其特征在于,计算所述第一协方差矩阵,具体包括: 采用如下方式计算所述第一协方差矩阵:
其中,所述卸A-)表示所述第一协方差矩阵、所述k表示所述任意一采样频点、所述P表 示所述麦克风阵列采集所述语音信号的帖的数量、所述Xi化)表示所述麦克风阵列在任意 一帖及所述任意一采样频点时的离散傅里叶变换DFT值、所述X作)表示所述Xi化)的共辆 转置矩阵、所述N表示任意一帖包括的采样频点的数量,任意两个不同帖所包括的采样频 点的数量均相同。
3. 如权利要求1或2所述的方法,其特征在于,计算所述聚焦变换矩阵之前,还包括: 确定所述麦克风阵列采集语音信号时采用的采样频点的聚焦频点; 计算所述麦克风阵列在所述聚焦频点采集到的语音信号的第二协方差矩阵; 计算所述聚焦变换矩阵,具体包括: 对所述第一协方差矩阵分解特征值,得到第一特征向量矩阵,并对所述第一特征向量 矩阵进行共辆转置,得到所述第一特征向量矩阵的共辆转置矩阵; 对所述第二协方差矩阵分解特征值,得到第二特征向量矩阵; 将所述第一特征向量矩阵的共辆转置矩阵、所述第二特征向量矩阵的乘积,作为所述 聚焦变换矩阵。
4. 如权利要求3所述的方法,其特征在于,计算所述第二协方差矩阵,具体包括: 采用如下方式计算所述第二协方差矩阵:
其中,所述句/^)表示所述第二协方差矩阵、所述k。表示所述聚焦频点、所述P表示所述 麦克风阵列采集所述语音信号的帖的数量、所述Xi化。)表示所述麦克风阵列在任意一帖及 所述聚焦频点时的DFT值、所述^. (/〇表示所述Xi(k。)的共辆转置矩阵。
5. 如权利要求3或4所述的方法,其特征在于,对所述第一协方差矩阵分解特征值,具 体包括: 采用如下方式对所述第一协方差矩阵分解特征值:

其中,所述旬A)表示所述第二协方差矩阵、所述u似表示所述矣(巧的第二特征向量矩 阵、所述A表示所述旬/〇的特征值按从大到小顺序排列所构成的对角矩阵、所述巧化)表 示所述U(k)的共辆转置矩阵。
6. 如权利要求3-5任一项所述的方法,其特征在于,对所述第二协方差矩阵分解特征 值,具体包括: 采用如下方式对所述第二协方差矩阵分解特征值:
其中,所述矣化)表示所述第二协方差矩阵、所述U(k。)表示所述耐的第二特征向量 矩阵、所述A。表示所述如A。)的特征值按从大到小顺序排列所构成的对角矩阵、所述巧化。) 表示所述U(k。)的共辆转置矩阵。
7. 如权利要求2-6任一项所述的方法,其特征在于,所述X i化)形式如下: Xi 化)=技U 化),X。化),......,X化化)]T,i = 0, 1,2,......,P-1 其中;Xii (k)表示所述麦克风阵列的第1个阵元在第i帖及第k个采样频点时的DFT 值、化)表示所述麦克风阵列的第2个阵元在第i帖及第k个采样频点时的DFT值、Xi^k) 表示所述麦克风阵列的第L个阵元在第i帖及第k个采样频点时的DFT值、所述L为所述 麦克风阵列包括的阵元的数量。
8. -种基于语音信号构造聚焦协方差矩阵的装置,其特征在于,包括: 确定单元,用于确定麦克风阵列采集语音信号时采用的采样频点; 第一计算单元,用于针对确定出的采样频点中的任意一个采样频点,计算在所述任意 一个采样频点采集到的语音信号的第一协方差矩阵、聚焦变换矩阵,及所述聚焦变换矩阵 的共辆转置矩阵,并将所述第一协方差矩阵、所述聚焦变换矩阵、所述聚焦变换矩阵的共辆 转置矩阵的乘积,作为在所述任意一采样频点采集到的语音信号的聚焦协方差矩阵; 第二计算单元,用于将计算得到的在各个采样频点分别采集得到的语音信号的聚焦协 方差矩阵之和,作为所述麦克风阵列采集到的语音信号的聚焦协方差矩阵。
9. 如权利要求8所述的装置,其特征在于,所述第一计算单元在计算所述第一协方差 矩阵时,具体为; 采用如下方式计算所述第一协方差矩阵:
其中,所述知表示所述第一协方差矩阵、所述k表示所述任意一采样频点、所述P表 示所述麦克风阵列采集所述语音信号的帖的数量、所述Xi化)表示所述麦克风阵列在任意 一帖及所述任意一采样频点时的离散傅里叶变换DFT值、所述X (A')表示所述Xi化)的共辆 转置矩阵、所述N表示任意一帖包括的采样频点的数量,任意两个不同帖所包括的采样频 点的数量均相同。

10. 如权利要求8或9所述的装置,其特征在于,所述确定单元还用于,确定所述麦克风 阵列采集语音信号时采用的采样频点的聚焦频点; 所述第一计算单元还用于,计算所述麦克风阵列在所述聚焦频点采集到的语音信号的 第二协方差矩阵; 所述第一计算单元在计算所述聚焦变换矩阵时,具体为: 对所述第一协方差矩阵分解特征值,得到第一特征向量矩阵,并对所述第一特征向量 矩阵进行共辆转置,得到所述第一特征向量矩阵的共辆转置矩阵; 对所述第二协方差矩阵分解特征值,得到第二特征向量矩阵; 将所述第一特征向量矩阵的共辆转置矩阵、所述第二特征向量矩阵的乘积,作为所述 聚焦变换矩阵。
11. 如权利要求10所述的装置,其特征在于,所述第一计算单元在计算所述第二协方 差矩阵时,具体为; 采用如下方式计算所述第二协方差矩阵:
其中,所述如^ )表示所述第二协方差矩阵、所述k。表示所述聚焦频点、所述P表示所述 麦克风阵列采集所述语音信号的帖的数量、所述Xi化。)表示所述麦克风阵列在任意一帖及 所述聚焦频点时的DFT值、所述(/〇表示所述Xi化。)的共辆转置矩阵。
12. 如权利要求10或11所述的装置,其特征在于,所述第一计算单元在对所述第一协 方差矩阵分解特征值时,具体为: 采用如下方式对所述第一协方差矩阵分解特征值: R{k) = U{k)\U {k) 其中,所述矣炸)表示所述第二协方差矩阵、所述u(k)表示所述知/〇的第二特征向量矩 阵、所述A表示所述卸/〇的特征值按从大到小顺序排列所构成的对角矩阵、所述巧化)表 示所述U(k)的共辆转置矩阵。
13. 如权利要求10-12任一项所述的装置,其特征在于,所述第一计算单元在对所述第 二协方差矩阵分解特征值时,具体为: 采用如下方式对所述第二协方差矩阵分解特征值: R{k) = Uik )\U {k ) 其中,所述矣化)表示所述第二协方差矩阵、所述U(k。)表示所述卸A。)的第二特征向量 矩阵、所述A。表示所述如A )的特征值按从大到小顺序排列所构成的对角矩阵、所述巧化。) 表示所述U(k。)的共辆转置矩阵。
14. 如权利要求9-13任一项所述的装置,其特征在于,所述X i化)形式如下: Xi 化)=技U 化),X。化),......,X化化)]T,i = 0, 1,2,......,P-1 其中;Xii (k)表示所述麦克风阵列的第1个阵元在第i帖及第k个采样频点时的DFT
值、Xi2 (k)表示所述麦克风阵列的第2个阵元在第i帖及第k个采样频点时的DFT值、Xi^k) 表示所述麦克风阵列的第L个阵元在第i帖及第k个采样频点时的DFT值、所述L为所述 麦克风阵列包括的阵元的数量。
【专利摘要】本发明公开了一种基于语音信号构造聚焦协方差矩阵的方法及装置:确定麦克风阵列采集语音信号时采用的采样频点;针对确定出的采样频点中的任意一个采样频点,计算在任意一个采样频点采集到语音信号的第一协方差矩阵、聚焦变换矩阵,及聚焦变换矩阵的共轭转置矩阵,并将第一协方差矩阵、聚焦变换矩阵、聚焦变换矩阵的共轭转置矩阵的乘积,作为在任意一采样频点采集到的语音信号的聚焦协方差矩阵;将计算得到的在各个采样频点分别采集得到的语音信号的聚焦协方差矩阵之和,作为语音信号的聚焦协方差矩阵,在该方案中,在构造聚焦协方差矩阵时,不需要预测声源的入射角度,而预测声源的入射角时存在误差,因此,提高了构造的聚焦协方差矩阵的准确度。
【IPC分类】G10L25-03
【公开号】CN104599679
【申请号】CN201510052368
【发明人】陈喆, 殷福亮, 张梦晗
【申请人】华为技术有限公司
【公开日】2015年5月6日
【申请日】2015年1月30日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1