语音信号处理装置及语音信号处理方法与流程

文档序号：14941773发布日期：2018-07-13 21:04阅读：201来源：国知局

本发明涉及一种信号处理装置，且特别是涉及一种语音信号处理装置及语音信号处理方法。

背景技术：

多频带的宽动态范围压缩(widedynamicrangecompression,wdrc)技术广泛在助听器的范围被使用，宽动态范围压缩的主要功能是提高响度小的语音信号的响度增益，以利辨识，并降低响度大的语音信号的响度增益，以避免声音太大造成不舒服。此外，为避免当输出语音信号的响度超过人耳能负荷的范围，必须将其限制在一定范围的响度之内，以保护耳朵避免听力受损。

一般来说，多频带的宽动态范围压缩是每一个频带各自独立进行语音信号的处理，各个频带的宽动态范围压缩曲线为依据个人需求进行听力检测所决定。在对输入语音信号进行宽动态范围压缩处理时，为分别以各个频带的语音信号的响度检测结果为基准配合对应的宽动态范围压缩曲线来决定各频带的输出语音信号的响度，其中各个频带对应的宽动态范围压缩曲线都包括响度的保护限制机制，使各个频带语音信号的响度无法大于其对应频带的响度限制值，以避免输出语音信号的响度过大。此处理方式虽可避免输出语音信号的响度过大，然而可能会使由各个频带的语音信号间的响度差距变小，而使得合成各个频带的语音信号所得到的输出语音信号的声音品质降低。

技术实现要素：

本发明提供一种语音信号处理装置及语音信号处理方法，可大幅地提高输出语音信号的声音品质。

本发明的语音信号处理装置包括滤波单元以及处理单元。滤波单元接收输入语音信号，对输入语音信号进行滤波，以产生不同频带的多个滤波信号。处理单元检测滤波信号的响度，以获得多个滤波响度，依据各滤波响度与各频带对应的宽动态范围压缩曲线分别计算各频带的滤波响度增益，其中各宽动态范围压缩曲线不具有输出响度上限。处理单元将滤波响度增益与增益下降调整值进行乘法运算，以得到多个调整增益，将各频带的调整增益分别与对应的滤波信号进行乘法运算，以得到多个响度调整滤波信号，将响度调整滤波信号进行加法运算，以产生加总滤波信号，检测加总滤波信号的响度，并判断加总滤波信号的响度是否小于第一临限值，若加总滤波信号的响度未小于第一临限值，降低增益下降调整值，直到加总滤波信号的响度小于第一临限值，若加总滤波信号的响度小于第一临限值，将加总滤波信号做为输出语音信号。

在本发明的一实施例中，上述的处理单元还依据第二临限值与加总滤波信号的响度的比值降低增益下降调整值，其中第二临限值小于或等于第一临限值。

在本发明的一实施例中，上述的第二临限值小于第一临限值一误差值。

在本发明的一实施例中，上述的增益下降调整值等于第二临限值与加总滤波信号的响度的比值的开根号值乘以前一次使用的增益下降调整值的乘积。

在本发明的一实施例中，上述各宽动态范围压缩曲线为单位增益曲线分别进行各频带对应的宽动态范围压缩处理后所得到的曲线，处理单元还依据各频带的宽动态范围压缩曲线上与各频带的滤波响度对应的第一输出响度以及单位增益曲线上与各频带的滤波响度对应的第二输出响度计算各频带对应的滤波响度增益。

本发明的语音信号处理方法，包括下列步骤：接收输入语音信号。对输入语音信号进行滤波，以产生不同频带的多个滤波信号。检测滤波信号的响度，以获得多个滤波响度。依据各滤波响度与各频带对应的宽动态范围压缩曲线分别计算各频带的滤波响度增益，其中各宽动态范围压缩曲线不具有输出响度上限。将滤波响度增益与增益下降调整值进行乘法运算，以得到多个调整增益。将各频带的调整增益分别与对应的滤波信号进行乘法运算，以得到多个响度调整滤波信号。将响度调整滤波信号进行加法运算，以产生加总滤波信号。检测加总滤波信号的响度。判断加总滤波信号的响度是否小于第一临限值。若加总滤波信号的响度不小于第一临限值，降低增益下降调整值，直到加总滤波信号的响度小于第一临限值。若加总滤波信号的响度小于第一临限值，将加总滤波信号做为输出语音信号。

在本发明的一实施例中，上述的语音信号处理方法还包括，依据第二临限值与加总滤波信号的响度的比值降低增益下降调整值，其中第二临限值小于或等于第一临限值。

在本发明的一实施例中，上述的第二临限值小于第一临限值一误差值。

在本发明的一实施例中，上述的增益下降调整值等于第二临限值与加总滤波信号的响度的比值的开根号值乘以前一次使用的增益下降调整值的乘积。

在本发明的一实施例中，上述各宽动态范围压缩曲线为一单位增益曲线分别进行各频带对应的宽频动态范围压缩处理后所得到的曲线，各频带对应的滤波响度增益为依据各频带的宽动态范围压缩曲线上与各频带的滤波响度对应的第一输出响度以及单位增益曲线上与各频带的滤波响度对应的第二输出响度计算得到。

基于上述，本发明的实施例依据不具有输出响度上限的宽动态范围压缩曲线调整各个频带的滤波信号的滤波响度增益，并藉由降低增益下降调整值来降低各个频带的滤波响度增益，以降低响度调整滤波信号的响度，使输出语音信号的响度低于第一临限值，如此便可避免不同频带的滤波信号间的响度差距因宽动态范围压缩曲线的响度限制而大幅地变小，进而提高输出语音信号的声音品质。

为让本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合所附图式作详细说明如下。

附图说明

图1是依照本发明一实施例的语音信号处理装置的示意图；

图2是依照发明一实施例的语音信号处理方法的流程示意图；

图3是依照本发明一实施例的宽动态范围压缩曲线的示意图；

图4是依照本发明一实施例的第一频带与第二频带的滤波信号与响度调整滤波信号的响度示意图。

符号说明：

102：滤波单元

104：处理单元

sf1～sfn：滤波信号

si1：输入语音信号

so1：输出语音信号

s202～s222：语音信号处理方法步骤

gc：增益下降调整值

gpa、gpb：滤波响度增益

gxa、gxb：基准响度增益

sf1、sf2：滤波信号

sf1’、sf2’：响度调整滤波信号

sz1：加总滤波信号

s1～s4：区间

gp：响度增益

th1：保护限制值

gd：响度差距

具体实施方式

图1是依照本发明一实施例的语音信号处理装置的示意图，请参照图1。语音信号处理装置包括滤波单元102以及处理单元104，滤波单元102耦接处理单元104，其中滤波单元102可例如以带通滤波器来实施，而处理单元104则可例如以中央处理单元来实施，然不以此为限。

滤波单元102用以对输入语音信号si1进行滤波，以产生多个不同频带的滤波信号sf1～sfn给处理单元104，其中n为大于1的正整数。处理单元104可检测检测滤波信号sf1～sfn的响度，以获得多个滤波响度，并依据各滤波响度与各频带对应的宽动态范围压缩曲线分别计算各频带的滤波响度增益。其中各宽动态范围压缩曲线不具有输出响度上限，各个频带对应的宽动态范围压缩曲线为单位增益曲线分别进行各个频带对应的宽动态范围压缩处理后所得到的曲线，各个频带的宽动态范围压缩曲线为依据个人需求进行听力检测所决定，不同频带所对应的宽动态范围压缩曲线可能不同。进一步来说，处理单元104可依据各个频带对应的宽动态范围压缩曲线上对应滤波响度的输出响度以及单位增益曲线上对应滤波响度的输出响度来计算滤波响度增益。

处理单元104可将各频带的滤波响度增益与增益下降调整值(增益下降调整值的初始值可设为1，然不以此为限)进行乘法运算，以得到多个调整增益，将各频带的调整增益分别与对应的滤波信号进行乘法运算，以得到多个响度调整滤波信号，将该些响度调整滤波信号进行加法运算，以产生加总滤波信号。处理单元104可检测加总滤波信号的响度，并判断加总滤波信号的响度是否小于第一临限值，若加总滤波信号的响度未小于第一临限值，降低增益下降调整值，直到加总滤波信号的响度小于第一临限值，若加总滤波信号的响度小于第一临限值，将加总滤波信号做为输出语音信号。其中处理单元104可例如依据第二临限值与加总滤波信号的响度的比值来降低增益下降调整值，此外第二临限值可例如小于或等于第一临限值，在部份实施例中，可设定第二临限值小于第一临限值一个误差值，例如使第一临限值等于第二临限值乘以1.01，亦即误差值为10％的第二临限值，然不以此为限。

如此依据不具有输出响度上限的宽动态范围压缩曲线调整各个频带的滤波信号的滤波响度增益，并藉由降低增益下降调整值来降低各个频带的滤波响度增益，以降低响度调整滤波信号的响度，而非如已知技术般以具有最大响度限制的宽动态范围压缩曲线来降低滤波信号的响度，可避免不同频带的滤波信号间的响度差距因宽动态范围压缩曲线的响度限制大幅地变小，进而提高输出语音信号的声音品质。

举例来说，图2是依照本发明一实施例的语音信号处理方法的流程示意图，请参照图2。在本实施例中，以产生2个不同频带的滤波信号sf1与sf2为例进行说明，然并不以此为限，在其它实施例中，滤波单元102可产生更多不同频带的滤波信号。本实施例的语音信号处理方法可包括下列步骤。首先，滤波单元102接收输入语音信号si1(步骤s202)，对输入语音信号si1进行滤波，以产生第一频带的滤波信号sf1(步骤s204a)以及第二频带的滤波信号sf2(步骤s204b)。处理单元104可检测第一频带的滤波信号sf1的响度，以获得第一滤波响度(步骤s206a)，并依据第一滤波响度与第一频带对应的宽频动态范围压缩曲线计算第一频带的滤波响度增益gpa(步骤s208a)。类似地，处理单元104可检测第二频带的滤波信号sf2的响度，以获得第二滤波响度(步骤s206b)，并依据第二滤波响度与第二频带对应的宽频动态范围压缩曲线计算第二频带的滤波响度增益gpb(步骤s208b)。其中，第一频带与第二频带的宽动态范围压缩曲线不具有输出响度上限。

举例来说，第一频带与第二频带的宽动态范围压缩曲线可例如为图3的宽动态范围压缩曲线的示意图所示，图3实施例的宽动态范围压缩曲线可区分为多个区间s1～s4，其中区间s1为线性区、区间s2为压缩区、区间s3以及区间s4为线性区，此外，虚线为单位增益曲线，亦即信号的输入响度等于输出响度。其中区间s1可用以帮助听障人士将微小的语音声音放大，区间s2可用以调节使用者听域的动态范围。区间s3宽动态范围压缩曲线与单位增益曲线重叠，因听障人士的饱和声压与正常人一样不需放大。此外，相较于在已知技术中，在区间s4设定用以限制输出语音信号so1的最大响度值(例如使输出响度最大为110db)，在本实施例中，区间s4与区间s3相同，亦为线性区而不限制输出响度。处理单元104可依据各个频带对应的宽动态范围压缩曲线上对应滤波响度的输出响度以及单位增益曲线上对应滤波响度的输出响度来计算滤波响度增益gp。

值得注意的是，在本实施例中，是假设第一频带与第二频带所对应的宽动态范围压缩曲线皆如图3所示，然不以此为限，在其它实施例中，第一频带与第二频带所对应的宽动态范围压缩曲线可不同于图3的宽动态范围压缩曲线，且第一频带与第二频带亦可对应不同的宽动态范围压缩曲线。

接着，在步骤s208a与s208b后，处理单元104可将第一频带的滤波响度增益gpa与第二频带的滤波响度增益gpb分别与增益下降调整值gc进行乘法运算，以分别得到第一调整增益gxa与第二调整增益gxb(步骤s210a、s210b)。其中若第一频带的滤波响度增益gpa与第二频带的滤波响度增益gpb为第一次产生，增益下降调整值gc可例如设定为初始值“1”。之后，处理单元104将第一频带的滤波信号sf1与第一频带的滤波响度增益gpa进行乘法运算，以得到第一响度调整滤波信号sf1’(步骤s212a)，并将第二频带的滤波信号sf2与第二频带的滤波响度增益gpb进行乘法运算，以得到第二响度调整滤波信号sf2’(步骤s212b)。

接着，处理单元104将第一响度调整滤波信号sf1’与第二响度调整滤波信号sf2’进行加法运算，以产生加总滤波信号sz1(步骤s214)，然后再检测加总滤波信号sz1的响度(步骤s216)，并判断加总滤波信号sz1的响度是否小于第一临限值(步骤s218)。若加总滤波信号sz1的响度未小于第一临限值，则降低增益下降调整值(步骤s220)，并回到步骤s210a与s210b重新计算第一调整增益gxa与第二调整增益gxb，并接着执行步骤s212a～s218等步骤。如此重复执行步骤s210a～s220以及s210b～s220，直到于步骤s218中判断出加总滤波信号sz1的响度小于第一临限值，即可将加总滤波信号sz1做为输出语音信号(s222)。

其中，处理单元104可例如依据第二临限值与加总滤波信号sz1的响度的比值来降低增益下降调整值，举例来说，增益下降调整值可等于第二临限值与加总滤波信号sz1的响度的比值的开根号值乘以前一次使用的增益下降调整值的乘积，也就是说第i次计算的增益下降调整值gc(i)＝gc(i-1)×(spllim/splz)^0.5，其中i为大于1的正整数，gc(1)等于1，spllim为第二临限值，splz为加总滤波信号sz1的响度。值得注意的是，在其它实施例中，增益下降调整值的计算方式并不以此为限，增益下降调整值gc(i)亦可例如为其它包括参数(spllim/splz)的函数，例如增益下降调整值gc(i)＝gc(i-1)×(spllim/splz)^0.25。此外，如上述实施例所述，第二临限值可例如小于或等于第一临限值，在部份实施例中，可设定第二临限值小于第一临限值一个误差值，例如使第一临限值等于第二临限值乘以1.01，亦即误差值为10％的第二临限值，然不以此为限。

如此依据不具有输出响度上限的宽动态范围压缩曲线调整第一频带与第二频带的滤波信号sf1与sf2的滤波响度增益，并藉由降低增益下降调整值来降低第一频带与第二频带的滤波响度增益，以降低第一响度调整滤波信号sf1’与第二响度调整滤波信号sf2’的响度，使输出语音信号的响度低于第一临限值，而非如已知技术般使用具有最大响度限制的宽动态范围压缩曲线来降低第一频带与第二频带的滤波信号sf1与sf2的响度，可避免不同频带的滤波信号间的响度差距因宽动态范围压缩曲线的响度限制而大幅地变小，进而提高输出语音信号的声音品质。

举例来说，图4是依照本发明一实施例之第一频带与第二频带的滤波信号与响度调整滤波信号的响度示意图。如图4所示，假设th1为为了避免听力受损所设定的保护限制值，当藉由图2实施例的宽动态范围压缩处理方式，透过降低增益下降调整值gc将输出语音信号so1的响度降低至低于保护限制值th1时，第一频带的第一响度调整滤波信号sf1’与第二频带的第二响度调整滤波信号sf2’(亦即降低响度后的滤波信号sf1与滤波信号sf2)的响度也必然会被降低至保护限制值th1。由于本发明并未如已知技术使用具有响度限制的宽动态范围压缩曲线来限制各个频带的最大输出响度，因此由图4可看出，本实施例的第一响度调整滤波信号sf1’与第二响度调整滤波信号sf2’间仍具有明显的响度差距gd，有效地避免滤波信号间的响度差距因宽动态范围压缩曲线的响度限制而大幅地缩小，进而提高输出语音信号so1的声音品质。

综上所述，本发明的实施例依据不具有输出响度上限的宽动态范围压缩曲线调整各个频带的滤波信号的滤波响度增益，并藉由降低增益下降调整值来降低各个频带的滤波响度增益，以降低响度调整滤波信号的响度，避免如已知技术般以具有最大响度限制的宽动态范围压缩曲线来降低滤波信号的响度，而可避免不同频带的滤波信号间的响度差距因宽动态范围压缩曲线的响度限制而大幅地变小，进而提高输出语音信号的声音品质，并使输出语音信号的响度低于第一临限值。

虽然本发明已以实施例揭示如上，然其并非用以限定本发明，任何所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作些许的更改与润饰，故本发明的保护范围当视权利要求所界定者为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杜博仁;张嘉仁;曾凯盟
技术所有人：宏碁股份有限公司
我是此专利的发明人