用于压缩音频信号中的动态的方法与流程

文档序号：12379523阅读：475来源：国知局

本发明涉及一种用于压缩例如从环境声音中获得或由音频源馈入的音频信号中的动态的方法。音频信号在此是从中产生用于用户的听力信号的信号。

背景技术：

在音频信号的信号处理中，对动态的压缩通常表示一种能够适宜地描绘具有大的电平差的和由此大的动态范围的声音信号的重要辅助手段。在待记录的和待处理的声音信号的电平中的大的差在音频信号的纯线性放大时会导致，在选得太大的放大系数时具有最大的电平振幅的信号分量在信号处理时导致超调，或者在选择得太小的放大系数时具有低的信号电平的信号分量没有令人满意的、特别是没有足够可听的输入进入处理完成的输出信号中。

在助听器领域中对动态的压缩表示了一种将听力信号适配到听力障碍者的受限的听力的可能性。听力障碍者的听力具有受限的动态范围，从而不必非常强地放大小的输入电平。然而对于大的输入电平，必须降低增益，因为这样放大的听力信号作为不舒服的大声被感觉。

对音频信号的动态的压缩在此面对具有取决于电平的放大系数的增益。在大多数情况下，通过说明了输入电平与输出电平之比的特征曲线表示的压缩特征曲线，直至输入电平的特定阈值，具有以恒定系数实现的线性增益，而对于超过阈值的输入电平，取决于电平地降低增益。如果相对彼此按照分贝描绘输入电平和输出电平，则由此得到按线段线性的走向，作为压缩特征曲线，其中特征曲线从输入电平的阈值开始具有较小的斜率。该斜率与对角线走向的偏差在此确定压缩比例r<1，以该压缩比例来压缩超过阈值的输入电平。

在大声环境中(其平均声音电平具有接近该阈值的相应的信号电平)，说话者通常倾向于，对环境中较高的噪声电平通过较大声地说话做出反应。对于其阈值取决于具有正常音量的说话的动态的压缩，这一点意味着，此时较大声的语音被压缩理解为有用信号分量，由此不期望地减小了信噪比。对于其他环境声音或来自于音频源的直接音频信号同样成立，其中从嘈杂的、沙沙响的或其他背景噪声要听出大声的有用或目标信号，例如单个乐器的信号等。通过压缩从有用信号中获得的音频信号或直接包含有用信号的音频信号，会将有用信号的声音在压缩的音频信号中感觉为不自然的和甚至不舒服的。特别地这一点在压缩的快速的建立(“attack”)和/或衰退(“release”)时发生。

技术实现要素：

本发明要解决的技术问题是，提出一种用于压缩音频信号中的动态的方法，其可以尽可能灵活地对不同响亮的环境做出反应并且在此特别对于可清楚定义的有用信号如说出的语音要具有尽可能自然的声音。

上述技术问题按照本发明通过一种用于压缩音频信号中的动态的方法解决，其中测量音频信号的至少一个输入电平，其中将测量的输入电平与边界值比较，其中将具有通过输入电平的基础值定义的拐点的、预先给出的压缩特征曲线适配到音频信号，方式是，当至少一个输入电平超过边界值时，将基础值的拐点提高到与此相比更高的目标值，并且其中按照适配后的压缩特征曲线来压缩音频信号。有利的和部分地视为发明性的构造形式是从属权利要求和以下描述的内容。

压缩特征曲线的拐点尤其理解为，对于直至定义了拐点的横坐标值的输入电平，输出电平通过以恒定的放大系数放大的输入电平给出，而对于超过该横坐标值的输入电平，增益根据输入电平降低。在此尤其包括，超过该拐点的压缩特征曲线具有本身取决于输入电平的、必要时按片段恒定的压缩比。在本情况下，对于预先给出的压缩特征曲线，定义了拐点的横坐标值通过基础值给出，所述基础值定义了通过目标值适配后的压缩特征曲线的拐点的横坐标值。

本发明在此从如下考虑出发，在待处理的音频信号中特别地在具有明显的背景噪音、其他环境或附加噪音或嘈杂声的有用信号中，用于建立或衰退(attack或release)的短的时间常数在强压缩情况下，即利用相对高的压缩比来压缩输入电平的情况下，会导致不自然的或甚至不舒服的听觉。说话者对于环境或背景噪音的电平的短时的、暂时的上升，通常通过较大声的说话来做出反应。此时如果在其中会发生电平的这样的改变的环境中，要记录音频信号(其有用信号通过说出的语音形成)以用于进一步处理，则输入电平在宽的动态范围上具有极大的变化，其特别地涉及有用信号。对于音乐信号或具有有用或目标信号的其他音频信号(其电平具有大的变化)，也同样适宜地成立。

如果压缩特征曲线此时主要对于特定的听力或环境情形而设计，即，如果在音频信号取决于电平衰减的意义上在特定的预先设置的输入电平(所述输入电平例如与有用信号的电平的预计的平均值相当地或超过其不多地被选择)的情况下压缩开始，则这导致有用信号被不期望地较强压缩。也就是在保持建立/衰退时间常数的情况下对于每个时间单位将此时较大声的有用信号更强地衰减，这由于处理完成的音频信号的所得到的听觉而是不期望的。然而通过延长相应的时间常数对暂时较高的输入电平的较强压缩进行的适配会导致，在具有本来提高的输入电平的音频信号中，不再能及时捕捉到短的电平尖峰并且该电平尖峰由此通过放大被超调。

本发明与此相对地建议，在输入电平短时地、暂时地提高时，将预先给出的压缩特征曲线适配到该提高，方式是，将压缩特征曲线的拐点相应地移动到输入电平的较高的值，并且在此不先验地改变压缩本身的时间常数。为了防止适配的不需要的跳跃或太快的响应，在此将输入电平与相应待选择的边界值比较，并且在超过边界值时才进行适配。优选地，在此对于宽带的输入信号的输入电平，选择在55dB和70dB之间的边界值。在取决于通道地、也就是频率分辨地考察输入信号的情况下，在各自的通道中优选地选择在40dB和55dB之间的边界值。选择的边界值在此尤其相应于典型的干扰噪音情形。

在一种优选变形中，将拐点提高到预定的目标值。预定的目标值在此基于经验值并且尤其取决于给定的听力情形或给定的特殊音频信号，例如音乐信号来选择。

在另一个有利的变形中，将拐点提高到取决于输入电平的目标值。在此采集输入电平，尤其在时间范围上取平均。如果超过对于尤其取平均的输入电平的边界值，则取决于采集的或取平均地采集的输入电平提高目标值。换言之，拐点被提高到的目标值的大小适配地跟随当前的或当前取平均的输入电平。例如拐点的目标值跟随电平测量器的取平均的输入电平，其具有缓慢的建立和衰退特性。由此可以在优选的构造中实现，拐点位于有用信号相关的信号尖峰下约3dB处。

此外这样来选择或设置用于输入电平与边界值的比较的开始调节时间(Einregelzeit)，使得不被一般的噪声电平的提高涉及的、极其短时的电平尖峰，不会导致压缩特征曲线的适配，而是比较过程由于调节时间虽然足够快速地响应于变化，但是其必须是一定的持续时间，以触发适配。

有利地，在压缩特征曲线的拐点提高的情况下为了补偿而降低总增益。优选地，在此这样降低总增益，使得对于通过其定义新的拐点的输入电平借助总增益的降低，与在该输入电平情况下初始地预先给出的压缩特征曲线相比将输出电平保持不变。由此仅对于位于拐点以下的输入电平的音量的感觉改变。通过对于在输入电平中的较高的平均音量来提高拐点而构造的压缩特征曲线，然后为了补偿而借助总增益(线性分量)的降低被映射到通过初始地预先给出的压缩特征曲线确定的动态走向。优选地，通过缩小在压缩特征曲线中的线性放大分量来进行总增益的降低。换言之，与初始的特征曲线比较，在较低的输入电平的范围，进行较小的增益，拐点移动到输入电平的较高值，而在较高的输入电平的范围中保持初始的增益。通过在此对于超过拐点目标值的输入电平保持音量的感觉，实现了调节伪迹(Regelartefakten)明显更小和环境噪音或其他不期望的背景噪音被较小放大的舒服的听觉。

优选地，当在超过边界值之后输入电平重新低于边界值时，为了将压缩特征曲线与音频信号适配，将拐点降低到基础值。由此可以对环境声音中的干扰和背景噪音的平均的声音电平的重新降低做出反应，从而压缩保持与分别相关的动态范围相适配。尤其，可以为此撤销先前为补偿压缩特征曲线的拐点提高而对总增益的降低，并且尤其可以为了检查该低于而考虑时间常数，使得当在超过之后输入电平对于输入电平的时间常数的整个持续时间保持低于边界值时，才认为重新低于边界值。

合适地，对于音频信号的压缩，建立(“attack”)的时间常数和/或衰退(“release”)的时间常数适配地取决于输入电平来确定。取决于输入电平来适配地确定压缩的建立和/或衰退时间常数，实现舒适的听觉，因为要同样考虑压缩对音频信号中的有用信号分量和背景噪音的作用，并且非常快速接通压缩通常会感觉为不自然。通过建立和/或衰退时间常数的适配性确定，可以对于音频信号的具有突然出现的、非常高的输入电平的信号分量，通过短时的接通时间，防止过量放大或超调，然而在输入电平的减弱振幅的情况下通过稍微较长的接通时间(Einschaltzeit)，获得自然的声音。

此外有利地，测量的输入电平与边界值的比较具有比对于压缩的接通时间常数或断开时间常数更长的调节时间(Einregelzeit)和/或更长的调整时间 (Ausregelzeit)。尤其，这可以意味着，对于超过边界值，关于调节时间，要求输入电平在整个开始调节时间期间超过边界值。

通过对于接通或断开压缩来选择与用于输入电平与边界值的比较的时间常数相比更短的时间常数，可以实现，携带了有用信号的信号的电平中的非常短时的、突然的变化不会导致压缩特征曲线的适配。输出信号中的这样的变化的作用通过压缩本身得到控制，其中用于接通或断开的短的时间常数也可以被适配地确定并且由此在确定的间隔内可以具有一定的变化。然而如果信号的电平中的上升持续较长时间，例如在变得大声的环境中的说话，则可能地假定，短时的动态特性和由此电平振幅，在本例中即说话者的腔调和断句等，跟随所述上升，由此压缩特征曲线的适配在该情况下是有利的。

在本发明的另一个有利构造中，将音频信号分解为多个频带，其中在频带的一个组中对于该组的每个频带，分别测量频带中音频信号的信号分量的输入电平，将测量的输入电平与特定于频带的边界值比较，将对于频带预先给出的压缩特征曲线适配到信号分量，并且根据适配的压缩特征曲线来压缩信号分量。尤其，组在此也可以仅包括一个频带，从而所述取决于输入电平将预先给出的压缩特征曲线适配到信号分量，仅在一个频带中进行，而在其他频带中不进行这样的适配。然而适配也可以对于多个频带进行，尤其也对于分解的音频信号的所有频带进行。尤其在此对于输入电平的特定于频带的边界值和/或预先给出的压缩特征曲线可以对于多个频带分别相同。

通过压缩特征曲线的特定于频带的适配，尤其可以在各个频带中以及其动态特性中更好考虑通常的或取决于听力情形而预计的干扰噪声的特定信号分量。尤其，在此，也可以特定于频带地进行适配，即，例如在各个频带中可以进行拐点到分别不同的目标值的提高。尤其，对于各自的频带中信号分量的输入电平与特定于频带的边界值的比较,各个调节时间和/或调整时间也可以超出频带地改变。提到的参数的特定于频带的适配允许对于尽可能真实的听觉来优化存在的资源，诸如计算能力。

本发明还涉及一种信号处理单元，包括用于馈入音频信号的信号输入端，其构造为执行前面描述的方法。对于方法和其扩展说明的优点在此可以合适地应用于信号处理单元。尤其，信号处理单元为此构造为具有相应构造的处理器，和/或对相应压缩的音频信号进一步处理和/或输出到信号输出端。

此外本发明还涉及一种助听器，尤其涉及一种助听设备，包括用于从环境声音中获得音频信号的至少一个麦克风，和前面描述的种类的与麦克风相连的信号处理单元。通过信号处理单元在助听器中实现的对音频信号的动态的压缩，在助听器中尤其在背景前通常变换的具有不同动态的以及对尽可能高质量的自然的声音的要求的听力情形特别有利。

附图说明

以下结合附图详细描述本发明的实施例。在此

图1示意示出了用于压缩音频信号中的动态的方法的流程框图，

图2示意性示出了通过按照图1的方法适配的、压缩特征曲线的电平图，

图3示出了助听设备。

具体实施方式

图1以框图示意性示出了方法1的流程。麦克风2从环境声音4获得音频信号6，所述环境声音通过未详细示出的语音信号形成，其由嘈杂声或噪音覆盖。替换地，音频信号6作为从音频源直接馈入的信号，例如作为音乐信号呈现，其中有用信号(例如单个乐器的信号或表演者的声音)又由背景噪音覆盖。音频信号6在滤波器组8中被拆分为多个频带10。在每个单个频带10中，此时分别测量在频带10中的音频信号6的信号分量14的输入电平12。将信号分量14的输入电平12与对于频带10特定地预先给出的边界值16比较，其中对于比较的过程，设置时间常数t1。此时如果关于时间常数t1平均的输入电平12超过了对于频带10规定的边界值16，则对于频带10预先给出的压缩特征曲线18以还要描述的方式适配到频带10中音频信号6的信号分量14。换言之，关于时间常数t1规定对于压缩特征曲线18的适配速度。附加地，为了补偿压缩特征曲线18的该适配，在频带10中降低总增益20。此时按照这样适配的压缩特征曲线22压缩频带10中音频信号6的信号分量14。对于按照适配后的压缩特征曲线进行的压缩的建立的时间常数t2以及对于衰退的时间常数t3在此尤其选择为比对于输入电平12与边界值16进行比较的时间常数t1更短。

如果通过在频带10中测量的、信号分量14的输入电平12没有超过边界值16，或者仅对于比时间常数t1明显更短的时间段超过，则将对于频带10预先给出的压缩特征曲线18不改变地作为与信号分量14适配的压缩特征曲线22来定义，并且将信号分量14相应地按照适配后的压缩特征曲线22压缩。这同样适用于如下情况，即：当之前通过信号分量14的输入电平12超过边界值16之后对于比通过时间常数t1给出的更长的时间段重新低于特定于频带的边界值16时。

在线图中示例地对于频带10之一示出了压缩特征曲线18的适配。在按照适配后的压缩特征曲线22压缩之后频带10的各个信号分量14可以被输送到下一个信号处理模块24，在其中音频信号6的信号分量14特定于频带地或宽带地被进一步处理。信号处理模块24在此例如可以包括用于噪声抑制的方法。

在图2中以电平图示出了通过按照图1的方法对压缩特征曲线18，22的示例适配。在此相对于输入电平12画出通过压缩得到的输出电平26。虚线的特征曲线相当于对于输入电平12不超过预先给出的边界值16的情况初始地对于宽带的音频信号16预先给出的压缩特征曲线18。预先给出的压缩特征曲线18在此直至输入电平的基础值28(其在本情况中处于值65dB处)地具有以放大系数1恒定增益的线性曲线。这意味着，音频信号6中的、其输入电平不超过65dB的信号分量，通过压缩模块在信号处理中被相同地继续。

通过输入电平12的基础值28，定义压缩特征曲线18的拐点30。具有大于65dB的输入电平12的信号分量根据输入电平以r＝1/2的压缩比衰减，由此压缩特征曲线18在拐点30处折弯。在图1中示出的压缩特征曲线18到信号分量14的输入电平12的适配此时首先设置用于：在通过采集的和尤其平均后的输入电平12超过边界值16的情况下才对于输入电平12的比基础值28更高的值激活以r＝1/2的压缩。为此将拐点30从基础值28提高到目标值32，其在本情况中为75dB。这意味着，此时对于具有直至75dB输入电平12的信号分量不进行压缩，而是对于高于75dB的输入电平才激活该压缩，并且相应地按照与压缩特征曲线18的特征曲线类似的对于输入电平12的依赖关系来压缩信号分量14。依赖关系在线图中通过虚线表示。

因为通过拐点30到输入电平12的更高的目标值32的移动，有效地对于高于基础值28的输入电平12提高信号功率，所以为了补偿，如下地降低总增益，使得在线图中通过实线表示的、适配后的压缩特征曲线22的特征曲线对于高于目标值32的输入电平12的值，与预先给出的压缩特征曲线18的特征曲线一致。这导致，在其中环境声音4带有说出的语音作为有用信号的听力情形中(所述有用信号被大声的干扰噪声覆盖)可以具有与声音较小的环境中类似的有用信号类似的信噪比。

通过降低总增益20，在本情况中降低5dB，在适配后的压缩特征曲线22中具有低于65dB的基础值28的输入电平12的信号分量，与预先给出的压缩特征曲线18相比，相应地降低5dB。与预先给出的压缩特征曲线18相比，在对于输入电平12的基础值28和目标值32之间的过渡区域中，相应地该降低较小地发生。然而因为假定，该降低首先涉及来自于环境的干扰噪声和背景噪声，而不涉及有用信号，由此可以实现信噪比的改善。

作为对于相应于图2的宽带的音频信号6的边界值16(从所述边界值起进行压缩特征曲线22的特别是适配性的适配)，例如选择70dB。适配性适配例如通过如下进行，即，取决于测量的、即具体是平均的输入电平12的值来选择目标值32。例如拐点的目标值跟随电平测量器的平均后的输入电平，其具有缓慢的建立和衰退特性。由此优选地实现，拐点在有用信号相关的信号尖峰下大约3dB处。

在图3中示出了助听器35，其构造为助听设备36。助听设备36包括用于从环境声音4中获得音频信号6的麦克风2，与麦克风2相连的信号处理单元38，音频信号6被馈入其中，和与信号处理单元38相连的扬声器40。信号处理单元38在此特别地构造为，根据输入电平按照前面描述的方法压缩由麦克风2从环境声音4中获得的音频信号6，并且将相应地压缩的输出信号为了播放传输到扬声器40。

尽管通过优选实施例详细示出和描述了本发明，但是本发明不受所述实施例限制。专业人员可以从中导出其他变化，而不脱离本发明的保护范围。

附图标记列表

1 方法

2 麦克风

4 环境声音

6 音频信号

8 滤波器组

10 频带

12 输入电平

14 信号分量

16 边界值

18 预先给出的压缩特征曲线

20 总增益

22 适配后的压缩特征曲线

24 信号处理模块

26 输出电平

28 基础值

30 拐点

32 目标值

35 助听器

36 助听设备

38 信号处理单元

40 扬声器

r 压缩比

t1 用于与边界值的比较的时间常数

t2 用于压缩的接通(“建立”)的时间常数

t3 用于压缩的断开(“建立”)的时间常数。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.佩特劳施;U.吉斯;S.佩普;
技术所有人：西万拓私人有限公司;
我是此专利的发明人

上一篇：用于双耳听力设备中的信号处理的方法与流程
上一篇：一种用于纯电动车的智能动力电源系统的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。