语音增强方法及装置的制造方法

文档序号:8261289阅读:398来源:国知局
语音增强方法及装置的制造方法
【专利说明】语音增强方法及装置
[技术领域]
[0001] 本发明涉及到语音增强领域,尤其涉及一种语音增强方法及装置。
[【背景技术】]
[0002] 用户使用听觉设备需要面对各种各样复杂的环境,目标语音随时在发生变化,如 有时是人声,有时候是音乐声,而且目标语音的强度,方位等,都随时在变化。同时,不可避 免受到噪声的干扰。
[0003] 不同场景中噪音种类千差万别。可能是稳态噪声,也可能是动态噪声,可能是冲击 噪声,也可能是风噪声。噪声可能是单频音,也可能是窄带噪声,甚至是宽带噪声。
[0004] 而且,不同的用户在不同的场景中对于目标语音的要求也是有差异的,举例说,在 相对安静的环境中,用户需要更加清晰的语音。而在相对嘈杂的环境中,则需要提高语音的 可懂度。
[
【发明内容】
]
[0005] 本发明提供了一种语音增强方法,以及和该方法对应的语音增强装置;用于在多 噪声环境下,能更加有效的对噪声掩蔽,对目标声源的语音信号进行增强,从而得到去噪的 语音,保证较高的语音质量。
[0006] 本发明的技术方案是:
[0007] 语音增强方法,包括:
[0008] 步骤一、从多个不同的空间位置采集多路带噪语音信号;
[0009] 步骤二、对所述带噪语音信号进行初步语音增强,以获得初步增强语音信号,然 后对所述初步增强语音信号进行分频和加窗逐帧处理,将其分割为N个语音T-F单元,并提 取每个语音T-F单元中的特征值;
[0010] 同时,对所述带噪语音信号进行分频和加窗逐帧处理,以得到N个噪声T-F单元, 提取每个噪声T-F单元的特征值并将其和设定值进行对比,根据比值确定各个噪声T-F单 元对应的掩蔽值,然后进行相应的掩蔽处理,以获得噪声参考信号;
[0011] 所述语音T-F单元和噪声T-F单元具有一一对应关系;
[0012] 步骤三、将每个语音T-F单元的特征值和其对应的经掩蔽后的噪声T-F单元的特 征值进行比较,并以比值为依据得到每个语音T-F语音单元相对应的掩蔽值,然后根据得 到的掩蔽值进行相应的掩蔽处理;
[0013] 步骤四、对经过掩蔽处理后的N个语音T-F单元进行合成,以获得最终的增强语音 信号。
[0014] 以及和上述方法对应的语音增强装置,包括:
[0015] 语音采集模块:用于从多个不同的空间位置采集多路带噪语音信号;
[0016] 语音增强模块:用于对所述语音采集模块采集到的带噪语音信号进行初步语音增 强,获得初步增强语音信号;
[0017] 第一人耳滤波模块:用于对所述语音增强模块中输出的初步增强语音信号进行分 频和加窗逐帧处理,形成N个语音T-F单元;
[0018] 第一特征提取模块:用于提取每个语音T-F单元的特质值;
[0019] 噪声参考模块:包括第二人耳滤波模块、第二特征提取模块、第二特征比较模块及 第二掩蔽模块;所述第二人耳滤波模块用于对带噪语音信号进行分频和加窗逐帧处理,以 形成N个噪声T-F单元,所述第二特征提取模块用于提取每个噪声T-F单元的特征值,所述 第二特征比较模块用于将每个噪声T-F单元的特征值和设定值进行对比,并根据比值确定 每个噪声T-F单元对应的掩蔽值,所述第二掩蔽模块用于对各噪声T-F单元进行掩蔽处理, 以获得噪声参考信号;
[0020] 第一特征比较模块:对语音T-F单元的特征值和所述噪声参考信号中的相应的噪 声T-F单元的特征值进行比较,根据比值确定每个语音T-F单元对应的掩蔽值;
[0021]第一掩蔽模块:根据所述第一特征比较模块得到的掩蔽值,对相应的语音T-F单 元进行掩蔽处理;
[0022] 语音信号重建模块:对经过第一掩蔽模块处理后的N个语音T-F单元进行合并,形 成增强后的语音信号用于输出。
[0023] 本发明实现了语音信号的360°的全面覆盖,并且信噪比相比于传统的噪声抑制 方法(如广义旁瓣对消)提升了 5-10dB,在多噪声环境下,能更加有效的对噪声掩蔽,对目标 声源的语音信号进行增强,保证较高的语音质量。
[【附图说明】]
[0024] 图1是本发明的语音增强方法在一实施例中的流程图;
[0025] 图2是现有技术的阻塞矩阵的方向性图;
[0026] 图3是现有技术的阻塞矩阵的方向性图;
[0027] 图4是本发明的语音增强装置在一实施例中的结构框图。
[【具体实施方式】]
[0028] 为了使本发明更加清晰明白,下面结合附图对本发明的具体实施例做一详细的阐 述。
[0029] 实施例1
[0030]如图1所示,语音增强方法,方法包括:
[0031] S100、从不同的空间位置采集两路带噪语音信号;当然,也可以是两路以上;
[0032]S200、所述S200步骤用于对步骤S100中得到的带噪语音信号进行处理,具体的处 理步骤包括并行的S210和S220,它们均是以S100中的带噪语音信号为基础,其中,S210是 从带噪语音信号中分离得到初步增强语音信号,并做进一步的处理,S220是从带噪语音信 号中分离出噪声,得到噪声参考信号;为便于描述,S210步骤进一步细化为S211、S212和 S213,在S220步骤进一步细化为S221、S222、S223和S224,具体如下:
[0033] S210:
[0034]S211:对步骤S100中得到的带噪语音信号进行初步语音增强,以获得初步增强语 音信号;
[0035]S212:对步骤S211中得到的初步增强语音信号进行分频和加窗逐帧处理,将其分 割为N个语音T-F单元;
[0036]S213:从步骤S212中得到的N个语音T-F单元中分别提取特征值;
[0037]S220:
[0038] S221 :对步骤S100中得到的带噪语音信号进行分频和加窗逐帧处理,以得到N个 噪声T-F单元;
[0039]S222:从步骤S221中得到的N个噪声T-F单元中分别提取特征值;
[0040]S223:将步骤S222中得到的每个噪声T-F单元的特征值和设定值进行对比,根据 比值确定每个个噪声T-F单元相应的掩蔽值;需要说明的是,所述设定值是根据目标声源 和各个采集点之间的相对位置关系来确定;
[0041]S224:以各个噪声T-F单元所对应的掩蔽值为加权参数,对各噪声T-F单元进行相 应的掩蔽处理,即抑制目标声源的语音信号,以获得噪声参考信号;
[0042] 举例说明,假设某个噪声T-F单元的特征值和设定值的比值为X,而x所对应的掩 蔽值为y,则得出该噪声T-F单元对应的掩蔽值为y,然后根据该y值,对该噪声T-F单元进 行掩蔽处理;
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1