声音信号的时延估计方法和装置的制造方法

文档序号:8382019阅读:289来源:国知局
声音信号的时延估计方法和装置的制造方法
【技术领域】
[0001] 本发明涉及音频处理技术领域,特别涉及一种声音信号的时延估计方法和装置。
【背景技术】
[0002] 声音信号的时延估计算法在声音匹配、编解码对齐、声音测距等诸多领域都得到 了广泛应用。
[0003] 现有技术也提供了多种不同的时延估计方法,其中一种应用较为广泛的时延估计 算法为基于相关分析的时延估计方法。该方法的基本思想为:利用两个声音信号在频域上 的相似程度估算出这两个声音信号间的时延。
[0004] 在实现本发明的过程中,发明人发现上述技术至少存在以下问题:上述基于相关 分析的时延估计方法仅考虑了两个声音信号在频域上的相似程度,使得两个声音信号的匹 配精度较低,导致最终计算得到的时延准确度较低。

【发明内容】

[0005] 为了解决上述技术涉及的时延估计方法存在的准确度低的问题,本发明实施例提 供了一种声音信号的时延估计方法和装置。所述技术方案如下:
[0006] 第一方面,提供了一种声音信号的时延估计方法,所述方法包括:
[0007] 获取两路声音信号;
[0008] 根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进行相干性匹配 得到第一匹配结果,所述第一匹配结果包括所述两路声音信号的第一匹配位置和第一匹配 度;
[0009] 根据所述两路声音信号的功率谱的谱间相关性对所述两路声音信号进行相干性 匹配得到第二匹配结果,所述第二匹配结果包括所述两路声音信号的第二匹配位置和第二 匹配度;
[0010] 根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信号间的时延。
[0011] 可选的,所述根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信号 间的时延,包括:
[0012] 对于每一路声音信号,对所述第一匹配位置和所述第二匹配位置采用加权平均算 法计算最终匹配位置,所述加权平均算法的权重是根据所述第一匹配度和所述第二匹配度 确定的;
[0013] 根据所述两路声音信号的所述最终匹配位置计算所述两路声音信号间的时延。
[0014] 可选的,所述根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进行 相干性匹配得到第一匹配结果,包括:
[0015] 对于每一路声音信号,按照下述公式对所述声音信号中的每一帧声音信号进行噪 声跟踪,获取每一帧声音信号的噪声谱N(W,n):
【主权项】
1. 一种声音信号的时延估计方法,其特征在于,所述方法包括: 获取两路声音信号; 根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进行相干性匹配得到 第一匹配结果,所述第一匹配结果包括所述两路声音信号的第一匹配位置和第一匹配度; 根据所述两路声音信号的功率谱的谱间相关性对所述两路声音信号进行相干性匹配 得到第二匹配结果,所述第二匹配结果包括所述两路声音信号的第二匹配位置和第二匹配 度; 根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信号间的时延。
2. 根据权利要求1所述的方法,其特征在于,所述根据所述第一匹配结果和所述第二 匹配结果计算所述两路声音信号间的时延,包括: 对于每一路声音信号,对所述第一匹配位置和所述第二匹配位置采用加权平均算法计 算最终匹配位置,所述加权平均算法的权重是根据所述第一匹配度和所述第二匹配度确定 的; 根据所述两路声音信号的所述最终匹配位置计算所述两路声音信号间的时延。
3. 根据权利要求1所述的方法,其特征在于,所述根据所述两路声音信号的短时傅里 叶变换对所述两路声音信号进行相干性匹配得到第一匹配结果,包括: 对于每一路声音信号,按照下述公式对所述声音信号中的每一帧声音信号进行噪声跟 踪,获取每一帧声音信号的噪声谱N(w,n):
其中,X(w,n)表示所述声音信号的短时傅里叶变换;au、ad为预设系数且0<ad <au< 1 ;w表不频域上的频点序号;n表不时域上的帧序号; 按照下述公式对每一帧声音信号的短时傅里叶变换进行二值化处理得到二值谱Xb(w,n):
将其中一路声音信号对应的Ka个二值谱与另一路声音信号对应的Kb个二值谱进行两 两间的相干性匹配得到所述第一匹配结果,所述第一匹配结果包括匹配度最高的一组二值 谱对应的匹配位置和匹配度,Ka、Kb均为正整数。
4. 根据权利要求1所述的方法,其特征在于,所述根据所述两路声音信号的功率谱的 谱间相关性对所述两路声音信号进行相干性匹配得到第二匹配结果,包括: 对于每一路声音信号,按照下述公式计算所述声音信号中的每一帧声音信号的功率谱P(w,n): P(w,n) =apP(w,n-l) + (l-ap) |X(w,n) |2; 其中,X(w,n)表示所述声音信号的短时傅里叶变换;ap为预设系数且0 <ap< 1 表示频域上的频点序号;n表示时域上的帧序号; 按照下述公式计算每一帧声音信号的功率谱的谱间相关性DP(w,n): DP(w,n) = |P(w+1,n)-P(w,n) | ; 按照下述公式对所述谱间相关性DP(w,n)进行噪声跟踪,获取每一帧声音信号的噪声 功率谱的谱间相关性NDP(w,n):
其中,0U、0d为预设系数且0 < 0 d< 0 u< 1 ; 按照下述公式对每一帧声音信号的所述谱间相关性DP(w,n)进行二值化处理得到相 关性二值谱XDb(w,n):
将其中一路声音信号对应的KDa个相关性二值谱与另一路声音信号对应的KDb个相关 性二值谱进行两两间的相干性匹配得到所述第二匹配结果,所述第二匹配结果包括匹配度 最高的一组相干性二值谱对应的匹配位置和匹配度,KDa、KDb均为正整数。
5. 根据权利要求1至4任一所述的方法,其特征在于,所述根据所述两路声音信号的短 时傅里叶变换对所述两路声音信号进行相干性匹配得到第一匹配结果之前,还包括: 对于每一路声音信号,对所述声音信号进行预处理得到预处理后的声音信号,所述预 处理包括降噪处理、放大处理、高通滤波处理、升降采样处理中的至少一种; 对所述预处理后的声音信号进行短时傅里叶变换。
6. -种声音信号的时延估计装置,其特征在于,所述装置包括: 信号获取模块,用于获取两路声音信号; 第一匹配模块,用于根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进 行相干性匹配得到第一匹配结果,所述第一匹配结果包括所述两路声音信号的第一匹配位 置和第一匹配度; 第二匹配模块,用于根据所述两路声音信号的功率谱的谱间相关性对所述两路声音信 号进行相干性匹配得到第二匹配结果,所述第二匹配结果包括所述两路声音信号的第二匹 配位置和第二匹配度; 时延计算模块,用于根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信 号间的时延。
7. 根据权利要求6所述的装置,其特征在于,所述时延计算模块,包括:位置计算单元 和时延计算单元; 所述位置计算单元,用于对于每一路声音信号,对所述第一匹配位置和所述第二匹配 位置采用加权平均算法计算最终匹配位置,所述加权平均算法的权重是根据所述第一匹配 度和所述第二匹配度确定的; 所述时延计算单元,用于根据所述两路声音信号的所述最终匹配位置计算所述两路声 音信号间的时延。
8. 根据权利要求6所述的装置,其特征在于,所述第一匹配模块,包括:第一跟踪单元、 第一二值化单元和第一匹配单元; 所述第一跟踪单元,用于对于每一路声音信号,按照下述公式对所述声音信号中的每 一帧声音信号进行噪声跟踪,获取每一帧声音信号的噪声谱Nb (w,n):
其中,X(w,n)表示所述声音信号的短时傅里叶变换;au、ad为预设系数且0<ad <au< 1 ;w表不频域上的频点序号;n表不时域上的帧序号; 所述第一二值化单元,用于按照下述公式对每一帧声音信号的短时傅里叶变换进行二 值化处理得到二值谱Xb(w,n):
所述第一匹配单元,用于将其中一路声音信号对应的&个二值谱与另一路声音信号对 应的Kb个二值谱进行两两间的相干性匹配得到所述第一匹配结果,所述第一匹配结果包括 匹配度最高的一组二值谱对应的匹配位置和匹配度,Ka、Kb均为正整数。
9. 根据权利要求6所述的装置,其特征在于,所述第二匹配模块,包括:功率谱计算单 元、相关性计算单元、第二跟踪单元、第二二值化单元和第二匹配单元; 所述功率谱计算单元,用于对于每一路声音信号,按照下述公式计算所述声音信号中 的每一帧声音信号的功率谱P(w,n): P(w,n) =apP(w,n-l) + (l-ap) |X(w,n) |2; 其中,X(w,n)表示所述声音信号的短时傅里叶变换;ap为预设系数且0 <ap< 1 表示频域上的频点序号;n表示时域上的帧序号; 所述相关性计算单元,用于按照下述公式计算每一帧声音信号的功率谱的谱间相关性DP(w,n): DP(w,n) = |P(w+1,n)-P(w,n) | ; 所述第二跟踪单元,用于按照下述公式对所述谱间相关性DP(w,n)进行噪声跟踪,获 取每一帧声音信号的噪声功率谱的谱间相关性NDP(w,n):
其中,0U、0d为预设系数且0 < 0 d< 0 u< 1 ; 所述第二二值化单元,用于按照下述公式对每一帧声音信号的所述谱间相关性DP(w,n)进行二值化处理得到相关性二值谱XDb(w,n):
所述第二匹配单元,用于将其中一路声音信号对应的KDa个相关性二值谱与另一路声 音信号对应的KDb个相关性二值谱进行两两间的相干性匹配得到所述第二匹配结果,所述 第二匹配结果包括匹配度最高的一组相干性二值谱对应的匹配位置和匹配度,KDa、KDb均为 正整数。
10. 根据权利要求6至9任一所述的装置,其特征在于,所述装置还包括: 信号预处理模块,用于对于每一路声音信号,对所述声音信号进行预处理得到预处理 后的声音信号,所述预处理包括降噪处理、放大处理、高通滤波处理、升降采样处理中的至 少一种; 傅里叶变换模块,用于对所述预处理后的声音信号进行短时傅里叶变换。
【专利摘要】本发明公开了一种声音信号的时延估计方法和装置,属于音频处理技术领域。所述方法包括:获取两路声音信号;根据两路声音信号的短时傅里叶变换对两路声音信号进行相干性匹配得到第一匹配结果,第一匹配结果包括两路声音信号的第一匹配位置和第一匹配度;根据两路声音信号的功率谱的谱间相关性对两路声音信号进行相干性匹配得到第二匹配结果,第二匹配结果包括两路声音信号的第二匹配位置和第二匹配度;根据第一匹配结果和第二匹配结果计算两路声音信号间的时延。解决了相关时延估计方法存在的准确度低的问题;从频域分布和功率谱的谱间相关性两个角度对声音信号进行匹配,综合两个匹配结果确定最终匹配结果,提高了匹配精度和时延估计准确度。
【IPC分类】G10L25-48, G10L25-18
【公开号】CN104700842
【申请号】CN201510083890
【发明人】陈超
【申请人】广州市百果园网络科技有限公司
【公开日】2015年6月10日
【申请日】2015年2月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1