多动态范围压扩方法和系统与流程

文档序号:25891187发布日期:2021-07-16 19:46阅读:119来源:国知局
多动态范围压扩方法和系统与流程

1.本发明涉及语音处理领域,尤其涉及一种多动态范围压扩方法、系统、计算机设备及计算机可读存储介质。


背景技术:

2.长时间暴露在大声压级环境,容易导致人的精神紧张和听力受损。人耳听到声音的频率成分主要是20hz到20ihz,根据不同的频率点有不同的听域。且,随着年龄增大,能够听到的频率成分的范围逐渐缩窄,听域范围会变窄。即,随着年龄增大或者听力受损,听域会逐渐往上升。为此,用于助听器被人们开发和使用。
3.助听器,能够将较微弱的信号能够提升到听力障碍者的听域范围内,如图1所示。
4.本发明人了解到,所述助听器一般采用以下两个方式进行信号放大:
5.(1)通过模拟元件对所有频率的信号进行统一放大,该方式能够将该听力障碍者在某个特定频段的信号放大到听域范围内,但是也会同等放大一些无用信号。
6.(2)通过数字处理器进行多动态范围压扩:对在不同的频段的信号进行差异化处理(放大)。在各个通道内放大的依据,是依照其各个频段范围内,信号的能量增益大小。上面介绍的多动态范围压扩,易会将背景噪音等无用信号随有用信号同等放大。
7.因此,当混响或噪音比较大时,经过动态范围压缩处理后的声音信号会严重影响听觉体验。


技术实现要素:

8.本发明的目的是提供一种多动态范围压扩方法、系统、计算机设备及计算机可读存储介质,解决或部分解决上述问题。
9.本发明实施例的一个方面提供了一种多动态范围压扩方法,用于助听器中,所述助听器包括前馈麦克风,所述前馈麦克风位于所述助听器远离耳道的一侧,所述方法包括:
10.获取所述前馈麦克风提供的输入信号;
11.分析所述输入信号的信号特征,所述信号特征包括信噪比和/或信混比;
12.根据所述信噪比和/或信混比,选择出所述动态范围压缩的目标增益函数;
13.根据所述输入信号的能量和所述目标增益函数,对所述输入信号进行动态范围压缩以得到目标信号。
14.可选的,所述输入信号的信号特征包括n个子带信号特征,n为>1的整数;所述分析所述输入信号的输入信号特征的步骤包括:
15.将所述输入信号分解成对应于n个通道的n个第一子带信号s
11
、s
12


s
1n
;及
16.分别对所述n个第一子带信号进行分析,以得到所述n个子带信号特征;
17.其中,每个子带信号特征包括相应第一子带信号的子带信噪比和/或子带信混比。
18.可选的,所述目标增益函数包括对应于所述n个通道的n个增益函数,所述n个通道与所述n个增益函数一一对应;所述根据所述信噪比和/或信混比,选择出所述动态范围压
缩的目标增益函数的步骤,包括:
19.比较第一阈值和与第i个通道对应的第i个子带信噪比,1≤i≤n,i为整数;
20.若所述第i个子带信噪比大于所述第一阈值,则选择多个增益函数中的第一增益函数作为对应于所述i个通道的第i个增益函数,所述多个增益函数预先设置得到;
21.若所述第i个子带信噪比不大于所述第一阈值,则将所述多个增益函数中的第二增益函数作为所述第i个增益函数;所述第一增益函数的斜率大于所述第二增益函数的斜率。
22.可选的,所述输入信号的能量包括对应于所述n个通道的n个子带能量,所述根据所述输入信号的能量和所述目标增益函数,对所述输入信号进行动态范围压缩以得到目标信号的步骤,包括:
23.根据所述n个第一子带信号生成n个目标子带信号,其包括:根据所述第i个增益函数和所述第i个通道的第i个子带能量,对对应于所述第i个通道的第i个第一子带信号进行动态范围压缩,以生成对应于所述第i个通道的第i个目标子带信号;及
24.合成所述n个目标子带信号,以得到所述目标信号。
25.可选的,所述助听器还包括vad元件,所述vad元件在所述助听器被佩戴时贴近所述佩戴者的耳道;所述方法还包括:
26.获取所述vad元件提供的反馈信号;
27.将所述反馈信号分解成对应于所述n个通道的n个第二子带信号s
21
、s
22


s
2n
,其中,第二子带信号s
2i
与对应的第一子带信号s
1i
对应于同一个通道;及
28.根据各个第二子带信号,判断所述各个通道是否包括所述佩戴者自己的声音信号;及
29.根据所述各个通道的判断结果,调整所述各个通道的增益函数;其中,每个通道对应一个判断结果,所述判断结果为第一判断结果或第二判断结果,所述第一判断结果用于表示相应通道中包括所述佩戴者的声音信号并用于指示降低所述相应通道的增益函数的斜率,所述第二判断结果用于表示所述相应通道中不包括所述佩戴者的声音信号。
30.可选的,还包括:
31.判断各个通道中是否包括冲击信号;
32.若其中一个通道中包括所述冲击信号,则调整这个通道的增益函数。
33.可选的,还包括:
34.判断所述输入信号是否包括风噪声信号;
35.若所述输入信号包括所述风噪声信号,则调整低于预设频点的各个通道的增益函数。
36.本发明实施例的一个方面又提供了一种多动态范围压扩系统,其特征在于,用于助听器中,所述助听器包括前馈麦克风,所述前馈麦克风位于所述助听器远离耳道的一侧,所述系统包括:
37.获取模块,用于获取所述前馈麦克风提供的输入信号;
38.分析模块,用于分析所述输入信号的信号特征,所述信号特征包括信噪比和/或信混比;
39.选择模块,用于根据所述信噪比和/或信混比,选择出所述动态范围压缩的目标增
益函数;
40.处理模块,用于根据所述输入信号的能量和所述目标增益函数,对所述输入信号进行动态范围压缩以得到目标信号。
41.本发明实施例的一个方面又提供了一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述多动态范围压扩方法的步骤。
42.本发明实施例的一个方面又提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述多动态范围压扩方法的步骤。
43.本发明实施例提供的多动态范围压扩方法、设备及计算机可读存储介质,通过信噪比和/信混比选择动态范围压缩的目标增益函数,可以防止噪音或混响过度放大。
附图说明
44.图1示意性示出了听域范围图;
45.图2示意性示出了出了助听器的结构示意图;
46.图3是基于信噪比进行动态范围压缩的流程图;
47.图4是动态范围压缩的一个增益函数的函数曲线图;
48.图5是基于信混比进行动态范围压缩的流程图;
49.图6是基于信噪比和vad进行动态范围压缩的流程图;
50.图7是基于信混比和vad进行动态范围压缩的流程图;
51.图8示意性示出了根据本发明实施例一的多动态范围压扩方法的流程图;
52.图9是图8中步骤s802的子流程图;
53.图10是图8中步骤s804的子流程图;
54.图11是图8中步骤s806的子流程图;
55.图12示意性示出了根据本发明实施例一的多动态范围压扩方法的新增步骤图;
56.图13示意性示出了根据本发明实施例一的多动态范围压扩方法的另一新增步骤图;
57.图14示意性示出了根据本发明实施例一的多动态范围压扩方法的另一新增步骤图;
58.图15是多动态范围压扩方法的另一流程图;
59.图16示意性示出了根据本发明实施例二的多动态范围压扩系统的框图;及
60.图17示意性示出了根据本发明实施例三的适于实现多动态范围压扩方法的计算机设备的硬件架构示意图。
具体实施方式
61.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
62.需要说明的是,在本发明实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
63.本发明涉及的术语解释:
64.vad(voice activity detection,语音活性检测),又称语音端点检测,用于检测语音信号是否存在。
65.信噪比(sigmal

to

noise ratio,snr),用于比较所需信号的强度与背景噪声的强度,为信号功率与噪声功率的比率,以分贝(db)为单位表示。大于比率1:1(高于0db)表示所需信号多于噪声。需要说明是,本发明中的信噪比用于描述电子信号。
66.信混比(sigmal

to

reverberation ratio,srr),为直达信号与反射信号之比。其中,所述直达信号为直接传送到前馈麦克风的信号。所述反射信号为经过反射并最终被前馈麦克风采集的信号。
67.动态范围压缩(wdrc,wide dynamic range compression),用于将输入信号调整到佩戴者听力的动态范围之内。例如,佩戴者适合听取的声音强度是90db spl(声压级)左右。若输入信号的能量强度为50db spl,则启动wdrc后会得到35db的增益。若输入信号为65db spl,则启动wdrc后会得到25db的增益。若输入信号为80db spl,则启动wdrc后会得到15db的增益。不难看出,随着声输入强度的增加,增益的幅度在逐渐减小。即,通过wdrc,可以把30db(80db
‑‑
50db)的输入范围等压缩到10db(本例中,最大输出为95db spl,最小输出为85db spl)的范围之内。
68.在本发明的描述中,需要理解的是,步骤前的数字标号并不标识执行步骤的前后顺序,仅用于方便描述本发明及区别每一步骤,因此不能理解为对本发明的限制。
69.图2示意性示出了根据本发明实施例的多动态范围压扩方法的环境应用示意图。所述多动态范围压扩方法可以被执行在助听器2中。
70.助听器2,包括外壳,该外壳内包括前馈麦克风21、vad元件22(可选的)、处理器23、扬声器24。
71.前馈麦克风21,位于助听器2远离耳道的一侧(外壳外侧),用于获取佩戴者的周围环境信号。
72.vad元件22,位于所述外壳的另一侧,即所述vad元件22在所述助听器被佩戴时位于所述佩戴者耳道内或贴近耳道。vad元件22可以用于获取反馈信号。其中,vad元件22可以为对震动信号敏感的元件,如骨传导麦克风或加速度传感器。由于语音会通过颅骨传导,vad元件22容易检测到佩戴者是否在说话。
73.处理器23,电连接前馈麦克风21、vad元件22和扬声器24,用于处理前馈麦克风21提供的输入信号,例如,宽动态范围压缩(wdrc)、波束形成等。在本实施例中,处理器23可以是dsp(digital signal processing,数字信号处理)芯片等。
74.扬声器24,用于接收经处理器23处理得到的目标信号,并将该目标信号输出到耳道4中。
75.硅胶套25,用于当助听器2被佩戴时,至少部分插入耳道4中。硅胶套25可以在一定程度阻断佩戴者周围的声音进入到耳道4中。当然,硅胶套25的材质可置换。
76.本发明在于提供多动态范围压扩方案,以提高佩戴者的听觉体验。
77.(1)前馈麦克风21提供的输入信号可能包括能量强度较大的噪声信号。通过wdrc对所需要的信号进行放大时,噪声信号也会放大,从而影响佩戴者的听觉体验。
78.因此,本发明提出了多个增益函数,以供选择。
79.当所述输入信号中的噪声信号的能量强度比较大时,则缩小所述输入信号的放大比例。具体如下:
80.当snr>5db,则采用第一增益函数;
81.当snr≤5db,则采用第二增益函数;
82.所述第一增益函数对应的函数曲线的斜率大于所述第二增益函数对应的函数曲线的斜率。
83.如图3所示,进一步的方案如下:
84.步骤s300:将所述输入信号分解成对应于n个通道的n个第一子带信号s
11
、s
12


s
1n

85.步骤s302:分别对所述n个第一子带信号进行分析,以得到所述n个子带信噪比
86.步骤s304:根据各个子带信噪比,对所述n个第一子带信号分别进行动态范围压缩操作,以得到n个目标子带信号s
out

87.作为示例,所述步骤s304可以包括步骤s304a

s304d,其中:步骤s304a:比较第一阈值(如,5db)和与第i个通道对应的第i个子带信噪比,1≤i≤n,i为整数;若所述第i个子带信噪比大于所述第一阈值,进入步骤s304b,否则进入步骤s304c。步骤s304b:选择多个增益函数中的第一增益函数作为对应于所述i个通道的第i个增益函数。步骤s304c:将所述多个增益函数中的第二增益函数作为所述第i个增益函数;所述第一增益函数的斜率大于所述第二增益函数的斜率。步骤s304d:根据所述n个第一子带信号生成n个目标子带信号:根据所述第i个增益函数和所述第i个通道的第i个子带能量,对对应于所述第i个通道的第i个第一子带信号进行动态范围压缩,以生成对应于所述第i个通道的第i个目标子带信号。
88.以下提供一个具体示例:采用分频段的多通道滤波器,将前馈麦克风21提供的输入信号从频率成分划分为n个频段(通道)。将各个通道内的第一子带信号的能量s
in
(i)(即能量强度,单位为声压级db spl)。由第i个通道的第i个第一子带信号,并根据人耳听力曲线的所对应压缩规则(增益函数),可以得到该第i个通道的第i个子带信号经过动态范围压缩后的第i个目标子带信号。如图4所示,其示出了与该第i个通道对应的增益函数的函数曲线。在图4中,s
in
(i)表示第i个第一子带信号的能量,s
out
(i)表示对所述第i个第一子带信号进行动态范围压缩后得到的第i个目标子带信号的能量。该函数曲线为斜率,即压缩比(r:1)。本示例对各个通道实施了差异化的动态范围压缩,用户体验更好。
89.步骤s306:合成所述n个目标子带信号,以得到所述目标信号。
90.(2)前馈麦克风21提供的输入信号可能包括能量强度较大的混响信号。通过wdrc对所需要的信号进行放大时,混响信号也会放大,从而影响佩戴者的听觉体验。
91.因此,本发明提出了多个增益函数。
92.当所述输入信号中的混响信号的能量强度比较大时,则缩小所述输入信号的放大
比例。具体如下:
93.当srr>5db,则采用第一增益函数;
94.当srr≤5db,则采用第二增益函数;
95.所述第一增益函数对应的函数曲线的斜率大于所述第二增益函数对应的函数曲线的斜率。
96.如图5所示,助听器2可以将检测信混比替代信噪比,通过比较第一阈值和与第i个通道对应的第i个子带信混比,来确定各个通道的增益函数,其他步骤不再赘述。
97.(3)前馈麦克风21提供的输入信号可能包括佩戴者自己的语音信号。通过wdrc对所需要的信号进行放大时,佩戴者自己的语音信号也会放大,从而影响佩戴者的听觉体验。
98.因此,如图6或图7所示,本发明还提供了以下方案:
99.助听器2可以通过vad元件22检测出佩戴者是否在在说话。当检测到佩戴者在说话时,则在进行动态范围压缩时,需要防止过度放大佩戴者自己的声音信号。
100.(4)前馈麦克风21提供的输入信号可能包括冲击信号。通过wdrc对所需要的信号进行放大时,所述冲击信号也会放大,从而影响佩戴者的听觉体验,甚至损害听力。
101.因此,本发明还提供了以下方案:
102.助听器2可以检测所述输入信号是否包括冲击信号,若所述输入信号包括冲击信号,则调整动态范围压缩的放大策略,如,在较短的时间内降低全频段的动态范围压缩的放大幅度。
103.本实施例中,可以通过时域信号能量来检测是否存在所述输入信号是否冲击信号,计算过程简单,计算资源消耗小、反应速度快,保障佩戴者有较好的听觉体验。
104.所述冲击信号的检测方案可以如下。
105.助听器2可以进一步配置一个参照麦克风,该参考麦克风位于远离耳道2的一侧,用于收集周围环境信号。该参照麦克风的灵敏度大于所述前馈麦克风的灵敏度。
106.对于具有较高灵敏度的参考麦克风来说:其动态范围会减小,送到处理器23的信号幅度会较大。当信号中包括冲击信号,会导致处理器23获取的该信号出现饱和。
107.由于饱和现象,处理器23从较高灵敏度的参考麦克风22得到的冲击信号的幅度被限定。即,处理器23从较高灵敏度的参考麦克风22得到的冲击信号的信号能量可能出现饱和。因此,处理器23从较高灵敏度的参考麦克风22得到的冲击信号和从较低灵敏度的前馈麦克风21得到的冲击信号之间的时域能量差异会缩小(如,小于某个特定阈值)。例如,前馈麦克风21采用正常灵敏度的麦克风(例如,灵敏度为

38dbv),参考麦克风22采用超高灵敏度的麦克风(例如,灵敏度为

23dbv)。因此,从较高灵敏度的参考麦克风22得到的冲击信号和从较低灵敏度的前馈麦克风21得到的冲击信号之间的时域能量差异小于15db时,则说明输入信号中可能出现冲击信号,且所述时域能量差越低,出现冲击信号的概率越大。
108.基于上述分析可知,可以基于能量比值,来判断是否存在冲击信号。
109.①
通过前馈麦克风21获取输入信号,并计算所述输入信号的第一时域信号能量;
110.②
通过参考麦克风22获取参考信号,并计算所述参考信号的第二时域信号能量;
111.③
对比所述输入信号的时域信号能量和所述参考信号的时域信号能量之间的时域能量差异,通过所述时域能量差异来判断佩戴者的周围环境中是否存在冲击信号。
112.如果所述时域能量差异大于预设能量差异阈值(15db),则判定存在冲击信号。
113.进一步的,本发明人发现:
114.由于冲击信号覆盖的频率范围为全频段,而语音主要集中在300

3400hz。
115.因此,可以针对4ihz以上的通道部分的判别,增大加权值。
116.而低频部分的加权值较低,该方案能够有效抵抗语音的干扰,使得冲击信号的判别更加鲁棒。
117.为了进一步地提升对于冲击信号的判断准确性,可以通过如下步骤判断是否存在冲击信号:
118.步骤一:对输入信号或参考信号分别进行多频段滤波,得到对应于n个通道的n个第一子带信号和对应于所述n个通道的n个第二子带信号,其中,所述n个第一子带信息根据输入信号得到,所述n个第二子带信息根据参考信号得到;
119.步骤二:计算第i个通道内的第一子带信号的子带平均能量和第一子带信号的子带瞬时峰值能量之间的时域能量差异以及所述第i个通道内的第二子带信号的子带平均能量和第二子带信号的子带瞬时峰值能量之间的时域能量差异,得到对应第i个通道的第i个判别结果,从而得到n个通道对应的n个判别结果,i为自然数,1≤i≤n;
120.步骤三:为每个通道分别配置一个权重值,频点高于4ihz的通道被配置较高的权重值,频点低于4ihz的通道被配置较低的权重值;
121.步骤四:根据所述n个判别结果中各个判别结果以及相应的权重值,综合判断是否存在冲击信号。
122.例如,当存在冲击信号,对应的判别结果为1;当不存在冲击信号,对应的判别结果为

1;频点高于4ihz的通道的权重值为0.5,频点低于4ihz的通道的权重值为0.2。其中,每个通道的判别结果在综合判断中的影响为:判别结果*通道的权重值。
123.上述综合加权值可以通过sigma等函数进行压缩,得到0

1之间的概率值。
124.概率值越高,说明存在冲击信号的可能性越大,在时域上对输入信号进行抑制的程度越大。
125.概率值越低,抑制的程度越轻。
126.(5)前馈麦克风21提供的输入信号可能包括风噪声信号。通过wdrc对所需要的信号进行放大时,所述风噪声信号也会放大,从而影响佩戴者的听觉体验。
127.因此,本发明还提供了以下方案:
128.助听器2可以检测所述输入信号是否包括风噪声信号。当检测所述输入信号包括所述风噪声信号,则在进行动态范围压缩时,需要降低低频段的动态范围压缩的放大幅度。
129.需要说明的是,上述方案(1)至(5)是可以自由组合,以根据需要得到不同的组合方案。
130.作为示例,将方案(1)和方案(2)组合,以根据第i个通道内的子带信噪比和子带信混比,共同决定该第i个通道所采纳的增益函数,从而进一步优化用户体验。
131.作为示例,将方案(1)和方案(3)组合,以根据第i个通道内的子带信噪比决定该第i个通道所采纳的增益函数,并当判断第i个通道内含有佩戴者自己的声音信号时,对通过方案(1)得到的增益函数进调整,例如,进一步缩小压缩比(即斜率)。
132.下文将提供多个实施例,下文提供的各个实施例可以用于实现上文描述的多动态范围压扩方法。为便于理解,下面将助听器2作为执行主体进行示例性描述。
133.实施例一
134.图8示意性示出了根据本发明实施例一的多动态范围压扩方法的流程图。
135.如图8所示,多动态范围压扩方法可以包括步骤s800~s806,其中:
136.步骤s800,获取前馈麦克风21提供的输入信号。
137.所述输入信号,采集于佩戴者周围的环境,包括语音信号、噪声信号等。
138.语音信号,包括他人的声音信号,也可以包括佩戴者自己的声音信号。
139.所述噪声信号,包括各种背景噪声信号、汽车鸣笛等的冲击信号、混响信号及风噪声信号等。
140.步骤s802,分析所述输入信号的信号特征,所述信号特征包括信噪比和/或信混比。
141.在本实施例中,所述信号特征包括信噪比、信混比。在另外一些实施例中,所述信号特征还可以包括:是否包括冲击信号、是否包括佩戴者自己的声音信号,是否包括风噪声信号等。结合这些信号特征,可以用于选择和调整wdrc中的增益函数。
142.步骤s804,根据所述信噪比和/或信混比,选择出所述动态范围压缩的目标增益函数。
143.助听器2配置有多个预设增益函数,以供选择。
144.信噪比越大,说明所述输入信号中的噪声信号越小;
145.信噪比越小,说明所述输入信号中的噪声信号越大。
146.当噪声信号较大时,若过度放大该噪声信号,则会影响用户听觉体验。
147.因此,可以基于信噪比来确定所述目标增益函数:
148.当信噪比较小时,则设置放大曲线更为平缓的增益函数作为所述目标增益函数,防止过度放大噪声。
149.步骤s806,根据所述输入信号的能量和所述目标增益函数,对所述输入信号进行动态范围压缩以得到目标信号。
150.本实施例提供的多动态范围压扩方法,通过信噪比和/信混比选择动态范围压缩的目标增益函数。当信噪比或信混比较小时(即超时信号或混响信号比较大),可以选择放大曲线更为平缓的目标增益函数,防止噪音或混响过度放大。
151.在示例性的实施例中,所述输入信号的信号特征包括n个子带信号特征,n为>1的整数。如图9所示,所述步骤s802可以包括步骤s900~s902,其中:步骤s900,将所述输入信号分解成对应于n个通道的n个第一子带信号s
11
、s
12


s
1n
;步骤s902,分别对所述n个第一子带信号进行分析,以得到所述n个子带信号特征;其中,每个子带信号特征包括相应第一子带信号的子带信噪比和/或子带信混比。通过获取每个第一子带信号的子带信号特征,可以更加有针对性地处理。
152.在示例性的实施例中,所述目标增益函数包括对应于所述n个通道的n个增益函数,所述n个通道与所述n个增益函数一一对应。如图10所示,所述步骤s804可以包括步骤s1000~s1004,其中:步骤s1000,比较第一阈值和与第i个通道对应的第i个子带信噪比,1≤i≤n,i为整数;步骤s1002,若所述第i个子带信噪比大于所述第一阈值,则选择多个增益函数中的第一增益函数作为对应于所述i个通道的第i个增益函数,所述多个增益函数预先设置得到;步骤s1004,若所述第i个子带信噪比不大于所述第一阈值,则将所述多个增益函
数中的第二增益函数作为所述第i个增益函数;所述第一增益函数的斜率大于所述第二增益函数的斜率。当某个通道的信噪比或信混比较小时(即噪声信号或混响信号的能量强度比较大),则可以为这个通道选择放大曲线更为平缓的增益函数,从而对这个通道内的第一子带信号做差异处理。
153.在示例性的实施例中,所述输入信号的能量包括对应于所述n个通道的n个子带能量。如图11所示,所述步骤s804可以包括步骤s1100~s1102,其中:步骤s1100,根据所述n个第一子带信号生成n个目标子带信号,其包括:根据所述第i个增益函数和所述第i个通道的第i个子带能量,对对应于所述第i个通道的第i个第一子带信号进行动态范围压缩,以生成对应于所述第i个通道的第i个目标子带信号;及步骤s1102,合成所述n个目标子带信号,以得到所述目标信号。助听器2还可以进一步判断所述目标信号的幅度是否大于预设阈值。若所述目标信号的幅度大于所述预设阈值,则对所述目标信号进行限幅处理,以防止信号失真。
154.在示例性的实施例中,所述助听器还包括vad元件,所述vad元件在所述助听器被佩戴时贴近所述佩戴者的耳道。如图12所示,所述方法还可以包括步骤s1200~1204,其中:步骤s1200,获取所述vad元件提供的反馈信号;步骤s1202,将所述反馈信号分解成对应于所述n个通道的n个第二子带信号s
21
、s
22


s
2n
,其中,第二子带信号s
2i
与对应的第一子带信号s
1i
对应于同一个通道;步骤s1204,根据各个第二子带信号,判断所述各个通道是否包括所述佩戴者自己的声音信号;及步骤s1206,根据所述各个通道的判断结果,调整所述各个通道的增益函数;其中,每个通道对应一个判断结果,所述判断结果为第一判断结果或第二判断结果,所述第一判断结果用于表示相应通道中包括所述佩戴者的声音信号并用于指示降低所述相应通道的增益函数的斜率,所述第二判断结果用于表示所述相应通道中不包括所述佩戴者的声音信号。举例而言,当通过第i个第二子带信号判断出与该第i个第二子带信号对应的通道内包括佩戴者自己的声音信号时,则调整这个通道的增益函数,如将这个通道的斜率调整地更加小,以防止过度放大佩戴者自己的声音信号,从而提升用户听觉体验。
155.在示例性的实施例中,如图13所示,所述方法还可以包括步骤s1300~1302,其中:步骤s1300,判断各个通道中是否包括冲击信号;步骤s1302,若其中一个通道中包括所述冲击信号,则调整这个通道的增益函数。举例而言,当判断出某个通道内包括冲击信号时,则可以调整这个通道的增益函数。例如,将这个通道的斜率调小,以防止过度放大这个通道内的冲击信号,从而提升用户听觉体验。
156.在示例性的实施例中,如图14所示,所述方法还可以包括步骤s1400~1402,其中:步骤s1400,判断所述输入信号是否包括风噪声信号;步骤s1402,若所述输入信号包括所述风噪声信号,则调整低于预设频点的各个通道的增益函数。举例而言,当判断出某个通道内包括风噪声信号时,则可以调整这个通道的增益函数。例如,将这个通道的斜率调小,以防止过度放大这个通道内的风噪声信号,从而提升用户听觉体验。
157.需要说明的是,当检测到某个通道内包括冲击信号、风噪声信号和佩戴者自己的声音信号时,则可以根据上述信号特征的权重值,共同调整对应于这个通道的增益函数。
158.为了方便理解,如图15所示,以下提供一个具体示例。
159.步骤s1,获取输入信号,该输入信号包括前馈麦克风21的信号;
160.步骤s2,通过滤波器组对所述输入信号进行分析,得到对应于多个通道的多个第一子带信号;
161.步骤s3,确定各个通道的动态范围压缩的增益函数;
162.各个通道的动态范围压缩的增益函数,影响因素可以包括如下:
163.第一、信噪比;
164.第二、信混比;
165.第三、冲击噪声;
166.第四、佩戴者自己的声音信号;
167.第五、风噪声;
168.以通道a为例:
169.(1)助听器2可以根据通道a的信噪比确定一个增益函数y;
170.(2)根信混比、冲击噪声、佩戴者自己的声音信号以及风噪声,在增益函数y的基础上,对输入信号的增益进行微调,从而进一步优化对应于通道a的动态范围压缩效果。
171.步骤s4:根据各个通道的增益函数,对各个通道内的第一子带信号进行相应的扩压处理;
172.步骤s5:合成基于步骤s4扩压得到的各个目标子带信号,以得到目标信号;
173.步骤s6:输出所述目标信号。
174.实施例二
175.如图16所示,图16示意性示出了根据本发明实施例二的多动态范围压扩系统1600的框图。该多动态范围压扩系统1600用于助听器中,所述助听器包括前馈麦克风和vad元件,所述vad元件在所述助听器被佩戴时位于所述佩戴者耳道内。该系统可以被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明实施例。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,以下描述将具体介绍本实施例中各程序模块的功能。
176.如图16所示,该多动态范围压扩系统1600可以包括获取模块1610、分析模块1620、选择模块1630和处理模块1640。其中:
177.获取模块1610,用于获取所述前馈麦克风提供的输入信号;
178.分析模块1620,用于分析所述输入信号的信号特征,所述信号特征包括信噪比和/或信混比;
179.选择模块1630,用于根据所述信噪比和/或信混比,选择出所述动态范围压缩的目标增益函数;
180.处理模块1640,用于根据所述输入信号的能量和所述目标增益函数,对所述输入信号进行动态范围压缩以得到目标信号。
181.可选的,所述输入信号的信号特征包括n个子带信号特征,n为>1的整数;所述分析模块1620,还用于:
182.将所述输入信号分解成对应于n个通道的n个第一子带信号s
11
、s
12


s
1n
;及
183.分别对所述n个第一子带信号进行分析,以得到所述n个子带信号特征;
184.其中,每个子带信号特征包括相应第一子带信号的子带信噪比和/或子带信混比。
185.可选的,所述目标增益函数包括对应于所述n个通道的n个增益函数,所述n个通道
与所述n个增益函数一一对应;所述选择模块1630,还用于:
186.比较第一阈值和与第i个通道对应的第i个子带信噪比,1≤i≤n,i为整数;
187.若所述第i个子带信噪比大于所述第一阈值,则选择多个增益函数中的第一增益函数作为对应于所述i个通道的第i个增益函数,所述多个增益函数预先设置得到;
188.若所述第i个子带信噪比不大于所述第一阈值,则将所述多个增益函数中的第二增益函数作为所述第i个增益函数;所述第一增益函数的斜率大于所述第二增益函数的斜率。
189.可选的,所述输入信号的能量包括对应于所述n个通道的n个子带能量;所述处理模块1640,还用于:
190.根据所述n个第一子带信号生成n个目标子带信号,其包括:根据所述第i个增益函数和所述第i个通道的第i个子带能量,对对应于所述第i个通道的第i个第一子带信号进行动态范围压缩,以生成对应于所述第i个通道的第i个目标子带信号;及
191.合成所述n个目标子带信号,以得到所述目标信号。
192.可选的,所述助听器还包括vad元件,所述vad元件在所述助听器被佩戴时贴近所述佩戴者的耳道;所述系统1600还包括第一调整模块,所述第一调整模块用于:
193.获取所述vad元件提供的反馈信号;
194.将所述反馈信号分解成对应于所述n个通道的n个第二子带信号s
21
、s
22


s
2n
,其中,第二子带信号s
2i
与对应的第一子带信号s
1i
对应于同一个通道;及
195.根据各个第二子带信号,判断所述各个通道是否包括所述佩戴者自己的声音信号;及
196.根据所述各个通道的判断结果,调整所述各个通道的增益函数;其中,每个通道对应一个判断结果,所述判断结果为第一判断结果或第二判断结果,所述第一判断结果用于表示相应通道中包括所述佩戴者的声音信号并用于指示降低所述相应通道的增益函数的斜率,所述第二判断结果用于表示所述相应通道中不包括所述佩戴者的声音信号。
197.可选的,所述系统1600还包括第一调整模块,所述第二调整模块用于:
198.判断各个通道中是否包括冲击信号;
199.若其中一个通道中包括所述冲击信号,则调整这个通道的增益函数。
200.可选的,所述系统1600还包括第一调整模块,所述第二调整模块用于:
201.判断所述输入信号是否包括风噪声信号;
202.若所述输入信号包括所述风噪声信号,则调整低于预设频点的各个通道的增益函数。
203.实施例三
204.如图17所示,图17示意性示出了根据本发明实施例三的适于实现多动态范围压扩方法的计算机设备1700的硬件架构示意图。本实施例中,计算机设备1700是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备,例如,可以是助听器,具有助听器功能的听力辅助设备等。如图17所示,计算机设备1700至少包括但不限于:可通过系统总线相互通信链接存储器1710、处理器1720、网络接口1730。其中:
205.存储器1710至少包括一种类型的计算机可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ran)、静态随机访
问存储器(sran)、只读存储器(ron)、电可擦除可编程只读存储器(eepron)、可编程只读存储器(pron)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器1710可以是计算机设备1700的内部存储模块,例如该计算机设备1700的硬盘或内存。在另一些实施例中,存储器1710也可以是计算机设备1700的外部存储设备,例如该计算机设备1700上配备的插接式硬盘,智能存储卡(snart nedia card,简称为snc),安全数字(secure digital,简称为sd)卡,闪存卡(flash card)等。当然,存储器1710还可以既包括计算机设备1700的内部存储模块也包括其外部存储设备。本实施例中,存储器1710通常用于存储安装于计算机设备1700的操作系统和各类应用软件,例如多动态范围压扩方法的程序代码等。此外,存储器1710还可以用于暂时地存储已经输出或者将要输出的各类数据。
206.处理器1720在一些实施例中可以是中央处理器(central processing unit,简称为cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器1720通常用于控制计算机设备1700的总体操作,例如执行与计算机设备1700进行数据交互或者通信相关的控制和处理等。本实施例中,处理器1720用于运行存储器1710中存储的程序代码或者处理数据。
207.网络接口1730可包括无线网络接口或有线网络接口,该网络接口1730通常用于在计算机设备1700与其他计算机设备之间建立通信链接。例如,网络接口1730用于通过网络将计算机设备1700与外部终端相连,在计算机设备1700与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global systen of nobile connunication,简称为gsn)、宽带码分多址(wideband code division nultiple access,简称为wcdna)、4g网络、5g网络、蓝牙(bluetooth)、wi

fi等无线或有线网络。
·
208.需要指出的是,图17仅示出了具有部件1710

1730的计算机设备,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
209.在本实施例中,存储于存储器1710中的多动态范围压扩方法还可以被分割为一个或者多个程序模块,并由一个或多个处理器(本实施例为处理器1720)所执行,以完成本发明实施例。
210.实施例四
211.本发明还提供一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时实现实施例中的多动态范围压扩方法的步骤。
212.本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ran)、静态随机访问存储器(sran)、只读存储器(ron)、电可擦除可编程只读存储器(eepron)、可编程只读存储器(pron)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(snart nedia card,简称为snc),安全数字(secure digital,简称为sd)卡,闪存卡(flash card)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中多动态范围压扩方法的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。
213.显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
214.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1