采用特征提取处理音频信号用于语音增强的方法和装置的制作方法

文档序号:2830176阅读:257来源:国知局
专利名称:采用特征提取处理音频信号用于语音增强的方法和装置的制作方法
技术领域
本发明涉及音频信号处理技术领域,特别地,涉及音频信号的语音增强领域,以便 处理的信号具有语音内容,该语音内容具有改进的客观或主观音频可懂度。发明背景和现有技术语音增强被应用于不同的应用。重要的应用是在助听器中使用数字信号处理。在 助听器中的数字信号处理提供用于听力损伤的复原的新的、有效的手段。除了较高的声学 信号质量之外,数字助听器考虑特定的语音处理策略。对于这些策略中的一些,听觉环境的 语音噪声比(Speech-to-Noise Ratio, SNR)的估计是希望的。具体地,考虑这样的应用,在 该应用中对于具体的声学环境优化用于语音处理的复杂算法,但是这类算法可能在不满足 具体的假设的场景下失败。这特别适用于可在安静的环境或在SNR低于某个阈值的场景中 引入处理人工因素的噪声减少方案。用于压缩算法和放大的参数的最佳选择可依据语音噪 声比,使得基于SNR估计的参数组的适应有助于证明该效果。此外,可直接采用SNR估计作 为用于噪声减少方案的控制参数,例如维纳滤波或谱减法。其他应用是在电影声音的语音增强领域。已经发现一些人具有理解电影语音内容 的问题,例如由于听力损伤。为了跟上电影的情节,理解音轨的有关语音是非常重要的,例 如,独白、对话、广播和讲述。听力困难的人常常经历相对于语音来说,背景声音例如环境噪 声和音乐以过高的水平被呈现。在这种情况中,希望增加语音信号的水平并衰减背景音乐 或,通常地,相对于总水平提高语音信号的水平。语音增强的主要方法是谱加权,也称为短时谱衰减,如图3中所示。通过依据在子 带信号中的噪声能量衰减输入信号X[k]的子带信号χ(ω)计算输出信号Kk]。在以下中,假设输入信号x[k]为希望的语音信号s[k]和背景噪声b[k]的加法的 混合。x[k] = s[k]+b[k](1)语音增强为语音的客观可懂度和/或主观质量的改进。通过如标号30表示的短时傅立叶变换(STFT)、其他时-频变换或滤波器组的方式 计算输入信号的频域表示。接着根据公式2在频域对输入信号进行滤波,鉴于计算滤波器 的频率响应G (ω),使得减小噪声能量。分别通过时-频变换或滤波器组的反向处理的方式 计算输出信号。γ(ω) = 6(ω)Χ(ω)(2) 在标号31处采用输入信号谱X ( ω )和噪声谱的估计力(ω),或者,相同地,采用线性 子带SNR的估计计算对每个谱值的合适的谱权重G(co)。 在标号32处将加权后的谱值变换回时域。噪声抑制规则的主要例子是谱相减 [S. Boll, "Suppression of acoustic noise in speech using spectral subtraction", IEEE Trans, on Acoustics,Speech,and Signal Processing,vol. 27,no. 2,pp. 113—120, 1979]和维纳滤波。假设输入信号为语音和噪声信号的相加混合,且语音和噪声是不相关联 的,在公式3中给出了用于谱相减方法增益值。
权利要求
1.一种用于处理音频信号以获得用于语音增强滤波器的控制信息的装置,包括特征提取器,用于获得所述音频信号的短时谱表示的时序和用于在用于多个短时谱表 示的多个频带的每个频带中提取至少一个特征,所述至少一个特征表示所述多个频带的频 带中的短时谱表示的谱形;和特征合并器,用于采用合并参数合并用于每个频带的至少一个特征,以获得用于所述 音频信号的时间部分的语音增强滤波器的控制信息。
2.根据权利要求1所述的装置,其中,所述特征提取器可操作以提取至少一个附加特 征,所述至少一个附加特征表示与所述谱形不同的短时谱表示的特性,和其中,所述特征合并器可操作以采用所述合并参数将所述至少一个附加特征与用于每 个频带的所述至少一个特征合并。
3.根据权利要求1所述的装置,其中,所述特征提取器可操作以应用频率变换操作,其 中,针对时刻序列获得谱表示序列,所述谱表示有具有非均勻带宽的频带,带宽随着频带的 中心频率的增加而变大。
4.根据权利要求1所述的装置,其中,所述特征提取器可操作以计算每个带的谱平坦 度量度作为第一特征,所述每个带的谱平坦度量度表示在所述带中的能量分布,或计算每 个带的归一化能量量度作为第二特征,所述归一化基于信号帧的总能量,所述谱表示从所 述信号帧的总能量得到,和其中,所述特征提取器可操作以采用用于带的所述谱平坦度量度或每个带的归一化能量。
5.根据前述权利要求任一项所述的装置,其中,所述特征提取器可操作以附加地提取 用于每个带的谱流量量度或提取谱偏量度,所述每个带的谱流量量度表示时间连续的谱表 示之间的类似性或相异性,所述谱偏量度表示围绕矩心的非对称性。
6.根据权利要求1所述的装置,其中,所述特征提取器可操作以附加地提取LPC特 征,所述LPC特征包括LPC误差信号、直到预定阶的线性预测系数或所述LPC误差信号和 所述线性预测系数的组合,或者其中,所述特征提取器可操作以附加地提取PLP系数或 RASTA-PLP系数或梅尔频率倒谱系数或Delta特征。
7.根据权利要求6所述的装置,其中,所述特征提取器可操作以计算用于时域音频采 样块的线性预测系数特征,所述块包括用于提取表示用于每个频带的谱形的所述至少一个 特征的音频采样。
8.根据权利要求1所述的装置,其中,所述特征提取器可操作以采用一个或两个直接 相邻频带的谱信息以及仅频带的谱信息计算频带中的所述谱的形状。
9.根据权利要求1所述的装置,其中,所述特征提取器可操作以提取用于每个音频采 样块的每个特征的原始特征信息和合并频带中的原始特征信息的序列以获得用于所述频 带的所述至少一个特征。
10.根据权利要求1所述的装置,其中,所述特征提取器可操作以计算用于每个频带的 多个谱值且合并所述多个谱值以获得表示所述谱形的所述至少一个特征,以便所述至少一 个特征具有小于所述频带中的所述谱值的数目的维数。
11.一种处理音频信号以获得用于语音增强滤波器的控制信息的方法,包括获得所述音频信号的短时谱表示的时序;提取用于多个短时谱表示的多个频带中的每个频带的至少一个特征,所述至少一个特 征表示所述多个频带的频带中的短时谱表示的谱形;和采用合并参数合并用于每个频带的至少一个特征,以获得用于音频信号的时间部分的 用于语音增强滤波器的所述控制信息。
12.一种用于在音频信号中语音增强的装置,包括根据权利要求1所述用于处理所述音频信号的装置,用于获得表示所述音频信号的时 间部分的用于多个带的滤波器控制信息;和可控滤波器,所述滤波器为可控的,以便基于所述控制信息所述音频信号的带相对于 不同的带被可变地衰减。
13.根据权利要求13所述的装置,其中,所述用于处理所述音频信号的装置包括提供 谱信息的时频变换器,所述控制信息被提供给所述时频变换器,所述谱信息具有比谱分辨 率高的分辨率;和其中,所述装置附加地包括控制信息后处理器,所述控制信息后处理器用于将所述控 制信息内插至所述高分辨率且平滑所述内插的控制信息以获得后处理的控制信息,基于所 述后处理的控制信息设置所述可控滤波器的可控滤波参数。
14.一种在音频信号中语音增强的方法,包括根据权利要求11所述的用于处理所述音频信号的方法,用于获得用于表示音频信号 的时间部分的用于多个带的滤波器控制信息;和控制滤波器以便基于所述控制信息所述音频信号的带相对于不同的带被可变地衰减。
15.一种用于训练特征合并器用于确定所述特征合并器的合并参数的装置,包括特征提取器,用于获得训练音频信号的短时谱表示的时序,其中针对所述训练音频信 号,用于每个频带的语音增强滤波器的控制信息是已知的,且用于提取用于多个短时谱表 示的多个频带的每个频带中的至少一个特征,所述至少一个特征表示所述多个频带的频带 中的短时谱表示的谱形;和优化控制器,用于向所述特征合并器提供用于每个频带的所述至少一个特征,用于采 用中间合并参数计算所述控制信息,用于改变所述中间合并参数,用于将所述改变的控制 信息与已知的控制信息进行比较,以及用于当所述改变的中间合并参数产生与所述已知的 控制信息更好地匹配的控制信息时,更新所述中间合并参数。
16.一种用于训练特征合并器用于确定所述特征合并器的合并参数的方法,包括获得训练音频信号的短时谱表示的时序,针对所述训练音频信号,用于每个频带的语 音增强滤波器的控制信息是已知的;提取用于多个短时谱表示的所述多个频带的每个频带中的至少一个特征,所述至少一 个特征表示所述多个频带的频带中的短时谱表示的谱形;向所述特征合并器提供用于每个频带的所述至少一个特征; 采用中间合并参数计算所述控制信息; 改变所述中间合并参数;将所述改变的控制信息与已知的控制信息进行比较;当所述改变的中间合并参数产生与所述已知的控制信息更好地匹配的控制信息时,更 新所述中间合并参数。
17. 一种计算机程序,用于当在计算机上运行时执行根据权利要求11、14或16所述的方法。
全文摘要
用于处理音频信号以获得用于语音增强滤波器(12)的控制信息的装置,该装置包括特征提取器(14)用于在用于多个短时谱表示的多个频带的每个频带提取至少一个特征,其中,所述至少一个特征表示所述多个频带的频带中的短时谱表示的谱形。该装置还包括特征合并器(15)用于采用合并参数合并用于每个频带的至少一个特征,以获得用于音频信号的时间部分的语音增强滤波器的控制信息。该特征合并器可采用神经网络回归方法,该神经网络回归方法基于在用于神经网络训练阶段中确定的合并参数。
文档编号G10L21/02GK102124518SQ200980131016
公开日2011年7月13日 申请日期2009年8月3日 优先权日2008年8月5日
发明者伯恩哈特·格里尔, 克里斯蒂安·乌勒, 奥立夫·赫尔穆特, 法尔科·里德布施 申请人:弗朗霍夫应用科学研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1