一种音量调节方法、装置、电子设备及存储介质与流程

文档序号:31339247发布日期:2022-08-31 09:39阅读:74来源:国知局
一种音量调节方法、装置、电子设备及存储介质与流程
一种音量调节方法、装置、电子设备及存储介质
1.本技术为申请日为2021年03月16日,申请号为202110289721.9,发明创造名称为“一种音量调节方法、装置、电子设备及存储介质”的分案申请。
技术领域
2.本技术涉及音频处理技术领域,更具体地说,涉及一种音量调节方法、装置、电子设备及存储介质。


背景技术:

3.在使用电子设备听音乐、看电影、语音通话时,音量调节是一种常见的用户操作。音频收听效果往往受到环境噪声的影响,用户为了听清音频播放的内容往往要通过修改时域信号幅度调整音量。
4.但是,在音量调节的过程中,申请人发现相关技术至少存在如下问题:在实际应用中用户仅听不清音频中的某些细节,当用户增大音量直至听见细节时将会导致原本能听清的内容音量过大,影响用户的收听效果。


技术实现要素:

5.本技术的目的在于提供一种音量调节方法、装置、电子设备及存储介质,可以合理调节音量,降低环境噪声对音频收听效果的影响。
6.为实现上述目的,本技术第一方面提供了一种音量调节方法,包括:
7.获取环境噪声并确定所述环境噪声的噪声能量分布信息;其中,所述噪声能量分布信息包括频率和噪声能量值的对应关系;
8.根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;
9.根据参考能量值对目标音频进行均衡预处理得到信号调节参数;其中,所述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量;
10.根据所述信号调节参数调节所述目标音频的频域信号幅度。
11.为实现上述目的,本技术第二方面提供了一种音量调节方法,包括:
12.采集人耳听觉特征信息;其中,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度;
13.若接收到音量调节指令,则根据人耳听觉特征信息确定目标音频对应的音量调节参数;其中,所述音量调节参数包括所述目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关;
14.根据所述音量调节参数调节所述目标音频的频域信号幅度。
15.为实现上述目的,本技术第三方面提供了一种音量调节装置,包括:
16.噪声能量分布确定模块,用于获取环境噪声并确定所述环境噪声的噪声能量分布信息;其中,所述噪声能量分布信息包括频率和噪声能量值的对应关系;
17.参考能量值确定模块,用于根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;
18.均衡预处理模块,用于根据参考能量值对目标音频进行均衡预处理得到信号调节参数;其中,所述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量;
19.幅度调节模块,用于根据所述信号调节参数调节所述目标音频的频域信号幅度。
20.为实现上述目的,本技术第四方面提供了一种音量调节装置,包括:
21.听觉特征采集模块,用于采集人耳听觉特征信息;其中,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度;
22.调节参数确定模块,用于若接收到音量调节指令,则根据人耳听觉特征信息确定目标音频对应的音量调节参数;其中,所述音量调节参数包括所述目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关;
23.音量调节模块,用于根据所述音量调节参数调节所述目标音频的频域信号幅度。
24.为实现上述目的,本技术第五方面提供了一种电子设备,包括存储器和处理器;
25.其中,所述处理器用于执行所述存储器中存储的程序;
26.所述存储器用于存储程序,所述程序至少用于:
27.获取环境噪声并确定所述环境噪声的噪声能量分布信息;其中,所述噪声能量分布信息包括频率和噪声能量值的对应关系;根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;根据参考能量值对目标音频进行均衡预处理得到信号调节参数;其中,所述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量;根据所述信号调节参数调节所述目标音频的频域信号幅度;
28.和/或,采集人耳听觉特征信息;其中,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度;若接收到音量调节指令,则根据人耳听觉特征信息确定目标音频对应的音量调节参数;其中,所述音量调节参数包括所述目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关;根据所述音量调节参数调节所述目标音频的频域信号幅度。
29.为实现上述目的,本技术第六方面提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上述音量调节方法的步骤。
30.通过以上方案可知,本技术提供的一种音量调节方法,包括:获取环境噪声并确定所述环境噪声的噪声能量分布信息;其中,所述噪声能量分布信息包括频率和噪声能量值的对应关系;根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;根据参考能量值对目标音频进行均衡预处理得到信号调节参数;其中,所述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量;根据所述信号调节参数调节所述目标音频的频域信号幅度。
31.本技术在获取环境噪声之后确定环境噪声的噪声能量分布信息,噪声能量分布信息中包括环境噪声中每一频率的噪声能量值。本技术根据噪声能量分布信息选取n个目标频率的对应的噪声能量值作为参考能量值,进而根据参考能量值对目标音频进行均衡预处理得到信号调节参数。由于信号调节参数包括目标音频中每一频率对应的目标频率幅度变化量,利用信号调节参数调节目标音频的频域信号幅度时,能够使目标音频中每一频率对
应的频率幅度变化量与同一频率的噪声能量值相关。通过上述调节方法可以使目标音频在噪声能量值较大的频域调整较大的能量值,在噪声能量值较小的频域调整较小的能量值,从而使得目标音频相较于环境噪声的能量在各个频带内均有抬升。因此,本技术提供的音量调节方法根据环境噪声分别对目标音频的各个频率的频域信号幅度进行调整,进而可以合理调节音量,降低环境噪声对音频收听效果的影响。
32.本技术还公开了一种音量调节装置、一种电子设备及一种存储介质,同样能实现上述技术效果。
33.应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本技术。
附图说明
34.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
35.图1为本技术实施例所提供的一种音量调节系统的架构图;
36.图2为本技术实施例所提供的一种音量调节方法的流程图;
37.图3为本技术实施例所提供的一种频域信号幅度的调节方法的流程图;
38.图4为本技术实施例所提供的一种音量检测方法的流程图;
39.图5为本技术实施例所提供的另一种音量调节方法;
40.图6为本技术实施例所提供的一种人耳听觉特征信息的采集方法的流程图;
41.图7为本技术实施例所提供的一种声音敏感度信息的确定方法的流程图;
42.图8为本技术实施例所提供的一种声音强度调节示意图;
43.图9为本技术实施例所提供的一种音量调节装置的结构示意图;
44.图10为本技术实施例所提供的另一种音量调节装置的结构示意图;
45.图11为本技术实施例提供的一种电子设备的结构图。
具体实施方式
46.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.为了便于理解本技术提供的音量调节方法,下面对其使用的系统进行介绍。参见图1,其示出了本技术实施例提供的一种音量调节系统的架构图,如图1所示,包括声音拾取装置101、终端102和音频播放装置103。声音拾取装置101可以用于拾取音频播放装置103播放音频时的音频声音,还可以用于拾取音频播放装置103不播放音频时的环境噪声。声音拾取装置101将拾取的音频内容传输至终端102,终端102可以根据环境噪声判断当前播放音
频的音量是否合适,若音量不合适则增大或减小当前播放音频的音量。音频播放装置103可以接收并播放终端102的音频信号。
48.本技术实施例公开了一种音量调节方法,可以合理调节音量,降低环境噪声对音频收听效果的影响。
49.参见图2,本技术实施例提供的一种音量调节方法的流程图,如图2所示,包括:
50.s201:获取环境噪声。
51.其中,本实施例可以应用于具有音频功能的电子设备中,该电子设备可以具有声音拾取装置(如麦克风)进而利用声音拾取装置拾取环境噪声,当然本实施例中的获取的环境噪声也可以由环境噪声检测设备传输至该电子设备。本步骤中获取的环境噪声可以为电子进行音量调节的电子设备所处位置的环境噪声。具体的,本实施例可以先关闭用于播放所述目标音频的音频播放装置,再将声音拾取装置拾取的声音作为所述环境噪声。
52.本步骤中作为一种可行的实施方式,本步骤中获取的环境噪声可以为当前时刻的环境噪声,本步骤可以按照预设周期获取环境噪声,以便根据最新的环境噪声对音频的播放音量进行调节。
53.s202:确定环境噪声的噪声能量分布信息。
54.其中,在获取了环境噪声的基础上,可以分析环境噪声中各个频率的噪声能量值得到噪声能量分布信息,该噪声能量分布信息中包括环境噪声的频率和噪声能量值的对应关系。具体的,本实施例可以通过welch频谱估计的方法得到环境噪声噪声能量分布信息。
55.s203:根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;
56.其中,由于环境噪声中每一频率的对应噪声能量值不完全相同,因此本实施例可以选取n个目标频率的对应的噪声能量值作为参考能量值,以便利用上述参考能量值确定各个频段中环境噪声的能量大小。
57.s204:根据参考能量值对目标音频进行均衡预处理得到信号调节参数;
58.其中,为了降低环境噪声对于目标音频的收听效果的影响,本实施例采取了根据噪声能量分布信息调节目标音频的频域信号幅度的方法来调节音量,使调节后的目标音频在各个频带内的信号幅度相对于环境噪声均有一定的抬升,从而提高目标音频的收听效果。具体的,上述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量,信号调节参数中每一频率对应的频率幅度变化量与同一频率的噪声能量值正相关。
59.s205:根据所述信号调节参数调节所述目标音频的频域信号幅度。
60.其中,由于信号调节参数中每一频率对应的频率幅度变化量与同一频率的噪声能量值正相关,在根据信号调节参数调节目标音频的频域信号幅度后,能够使调节后的目标音频在各个频带内的信号幅度相对于环境噪声均有一定的抬升,以便用户更易识别目标音频,降低环境噪声的干扰,提高目标音频的收听效果。例如,环境噪声在低频具有较高能量但在中频和高频能量为0时,通过本实施例的音量调节方案,可以增加目标音频在低频的频域信号幅度,对目标音频在中频和高频的频域信号幅度不进行改变,调整后的目标音频相对于环境噪声的能量有一定的抬升提高了收听效果。相对于相关技术中增加时域信号幅度的方案,本实施例针对环境噪声的噪声能量分布信息对频域信号幅度进行调整,实现了合理调节音量,降低环境噪声对音频收听效果的影响。
61.进一步的,由于环境噪声实时变化,环境噪声的噪声能量分布信息也会随时间改变,因此本实施例可以在获取新的环境噪声之后,生成新的噪声能量分布信息,进而根据新的噪声能量分布信息生成新的信号调节参数,以便实现根据环境噪声实时自动调节目标音频的音量,避免用户反复手动调节,提高了音量调节的时效性和准确性。
62.本实施例在获取环境噪声之后确定环境噪声的噪声能量分布信息,噪声能量分布信息中包括环境噪声中每一频率的噪声能量值。本实施例根据噪声能量分布信息选取n个目标频率的对应的噪声能量值作为参考能量值,进而根据参考能量值对目标音频进行均衡预处理得到信号调节参数。由于信号调节参数包括目标音频中每一频率对应的目标频率幅度变化量,利用信号调节参数调节目标音频的频域信号幅度时,能够使目标音频中每一频率对应的频率幅度变化量与同一频率的噪声能量值相关。通过上述调节方法可以使目标音频在噪声能量值较大的频域调整较大的能量值,在噪声能量值较小的频域调整较小的能量值,从而使得目标音频相较于环境噪声的能量在各个频带内均有抬升。因此,本实施例提供的音量调节方法根据环境噪声分别对目标音频的各个频率的频域信号幅度进行调整,进而可以合理调节音量,降低环境噪声对音频收听效果的影响。
63.作为对于图2对应实施例的进一步介绍,上述实施例可以先进行归一化映射再选取参考能量值,具体过程可以包括:对所述噪声能量分布信息中的噪声能量值归一化映射至目标区间;根据归一化映射后的噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值。本实施例通过将噪声能量值归一化映射至目标区间,可以有效防止后续设置的增益出现溢出。
64.作为对于图2对应实施例的进一步介绍,本实施例可以通过以下方式确定所述环境噪声的噪声能量分布信息:计算所述环境噪声的噪声频谱能量;对所述噪声频谱能量执行a计权的反向数值加权操作得到所述环境噪声的噪声能量分布信息。
65.举例说明上述过程:利用welch频谱估计方法计算当前噪声环境各个频率成分的能量值hnoise(w)。将其hnoise(w)按照a计权的反向数值做加权操作得到环境噪声的噪声能量分布信息hnoiseweight(w),即:
66.hnoiseweight(w)=10*log10(hnoise(w)*(max(aweight)+min(aweight)-aweight(w)))。
67.其中,函数min()表示向量的最小值,max()表示向量的最大值。
68.为了防止后续设置的增益出现溢出,可以将hnoiseweight(w)做整体归一化,映射到0-6db之间。即:hnoiseweightnorm(w)=6*(hnoiseweight(w)

min(hnoiseweight(w)))/(max(hnoiseweight(w))

min(hnoiseweight(w)))。
69.请参见图3,图3为本技术实施例所提供的一种频域信号幅度的调节方法的流程图,本实施例是对图2对应实施例中s103中根据噪声能量分布信息调节目标音频的频域信号幅度过程的进一步介绍,可以将本实施例与图1对应的实施例相结合得到进一步的实施方式,本实施例可以包括以下步骤:
70.s301:生成噪声能量分布信息对应的拟合曲线。
71.其中,噪声能量分布信息包括频率和噪声能量值的对应关系,本实施例可以基于该对应关系生成噪声能量分布信息对应的拟合曲线。本实施例得到的拟合曲线的横轴为频率值、纵轴为噪声能量值,根据拟合曲线可以确定环境噪声在任一频率下的噪声能量值。
72.s302:在拟合曲线上选取n个目标频率的对应的噪声能量值作为参考能量值。
73.作为一种可行的实施方式,本实施例可以选取n段均衡器的中心频率作为目标频率,例如可以选取31.5hz、63hz、125hz、250hz、500hz、1khz、2khz、4khz、8khz、16khz作为目标频率。作为一种另可行的实施方式,本实施例可以将人耳听觉频率范围(20hz到20khz)划分为n个跨度相同的频率区间,并将每一频率区间的中心频率作为目标频率。
74.s303:根据参考能量值对目标音频进行均衡预处理得到信号调节参数。
75.具体的,本实施例中对目标音频进行均衡预处理的过程可以包括:根据参考能量值确定目标音频在目标频率的频率幅度变化量,根据调整后目标频率的频率幅度变化量拟合得到目标音频中所有频率的频率幅度变化量。本实施例可以根据目标音频中每一频率的频率幅度变化量确定信号调节参数,信号调节参数中包括目标音频中每一频率对应的目标频率幅度变化量。
76.s304:根据所述信号调节参数调节所述目标音频的频域信号幅度。
77.在确定信号调节参数之后可以对根据每一频率的频率幅度变化量对频域信号幅度进行调节。上述实施方式通过选取n个目标频率的对应的噪声能量值作为参考能量值,基于参考能量值对目标音频的所有频率进行均衡预处理得到所有频率的目标频域信号幅度,提高了频域信号幅度的调节效率,进而提高了音量调节的实时性,以便在环境噪声发生变化使对目标音频的音量进行快速调节。
78.作为对于图3对应实施例的进一步介绍,本实施例可以通过慢更新的方式调节目标音频的频域信号幅度,保证听感上信号能量波动较为平滑。
79.慢更新的过程可以包括:根据所述信号调节参数确定当前时刻播放所述目标音频的目标频率幅度变化量;确定上一时刻播放所述目标音频的实际频率幅度变化量;确定当前时刻播放所述目标音频的实际频率幅度变化量,并根据所述当前时刻播放所述目标音频的实际频率幅度变化量调节所述目标音频的频域信号幅度;其中,所述当前时刻播放所述目标音频的实际频率幅度变化量在幅度变化量区间内;所述幅度变化量区间为开区间,所述幅度变化量区间的端点值为所述上一时刻播放所述目标音频的实际频率幅度变化量,以及当前时刻播放所述目标音频的目标频率幅度变化量。
80.进一步的,在环境噪声不变化的前提下,下一时刻可以不根据慢更新的方式调节所述目标音频的频域信号幅度,直接按照目标频率幅度变化量调节目标音频的频域信号幅度。
81.作为一种可行的实施方式,慢更新的过程可以利用预设公式调节所述目标音频的频率幅度变化量;其中,所述预设公式为en=α
·en-1
+(1-α)en′
;en为当前时刻播放所述目标音频的实际频率幅度变化量,α为预设参数,e
n-1
为上一时刻播放所述目标音频的实际频率幅度变化量,en′
为所述信号调节参数对应的目标频率幅度变化量。
82.请参见图4,图4为本技术实施例所提供的一种音量检测方法的流程图,本实施例是对图1对应实施例息调节目标音频的频域信号幅度之后的进一步介绍,可以将本实施例与图1对应的实施例相结合得到进一步的实施方式,本实施例可以包括以下步骤:
83.s401:利用声音拾取装置拾取播放目标音频时的总声音数据;
84.其中,所述总声音数据包括所述目标音频的声音和环境噪声。
85.s402:判断总声音数据的声音强度是否大于额定分贝值;若是,则进入s403;若否,
则判定当前播放音量正常。
86.本实施例中提到的额定分贝值为不影响人耳听力的最大分贝值,额定分贝值可以灵活设置,例如额定分贝值可以为90分贝。若音频声音与环境噪声的声音强度之和大于额定分贝值则执行s403中的第一预设操作,也可以执行第二预设操作,还可以执行第一预设操作和第二预设操作。
87.s403:执行第一预设操作和/或第二预设操作;
88.其中,所述第一预设操作为生成音量过大的提示信息,音量过大的提示信息可以为振动信息、语音信息等。第二预设操作为降低所述目标音频的频域信号幅度,以避免声音过大损伤听力。
89.作为对于图4对应实施例的进一步补充,执行第二预设操作的过程可以包括:将所述总声音数据中声音强度大于额定分贝值的频率点作为待调节频率点,并降低所述目标音频在所述待调节频率点的频域信号幅度。通过上述方式,降低目标音频中与环境噪声叠加后声音强度过大的频率点的频域信号幅度,避免目标音频与环境噪声叠加后某一频率的声音强度过大损伤听力。
90.作为一种可行的实施方式,本实施例可以在s401之后、s402之前确定总声音数据的声音强度,具体方式如下:对总声音数据的音频频谱能量执行a计权处理得到加权频谱能量,并根据加权频谱能量与声音强度的映射关系确定所述音频声音的声音强度。
91.下面以手机为例上述确定音频声音和环境噪声的声音强度过程:
92.采用手机麦克风拾取现场的声音信号。当手机扬声器播放音频时,麦克风拾取包括音频数据和环境噪声的总声音数据(设定每一帧的数据长度为n)。利用welch频谱估计方法,计算出该帧总声音数据的频谱能量h(w)。其中,w为频率,由于频域信号具有共轭对称性质,因此w可以取0-fs/2的频率值,fs表示音频信号的采样率。
93.为了符合人耳对不同频率的响度感知特性,将频谱能量做a计权处理,即:hweight(w)=h(w)*aweight(w)2;其中,函数aweight()表示为不同频率提供不同的权重值。由于h(w)是频谱能量值,而非幅度值,因此加权值是幅度权重的平方。
94.单位时间内的一帧总声音数据的能量值e可表示为:
95.e=mean(hweight(w))/(n/fs);
96.其中,函数mean表示求向量的均值。
97.将一帧总声音数据的能量值变换为声音强度eon,即:
98.eon=10*log10(e)+c;
99.其中,函数log10()表示以10为底的对数,常数c表示校正值。
100.在得到总声音数据的声音强度eon之后,还可以在使手机扬声器暂停播放音频,并在同一位置拾取环境噪声。可以对环境噪声执行上述对声音信号同样的welch频谱估计、a计权处理、计算能量值和能量值转换为声音强度的操作,最终得到环境噪声的声音强度eoff。一般的,eon大于eoff的分贝值超过20db便能够很容易听清楚扬声器所播放的声音。总声音数据的声音强度eon能量不宜超过90db。进一步的,当手机使用耳机播放音频时,可以将播放着音频的耳机出音孔对准手机麦克风的拾音孔,从而测得耳机发出的声音信号的强度。本实施例提出了一种简易可行的测试用户听音环境声音强度的方案,本实施例不需要借助于专业声学麦克风,便可为用户提供当前环境总的声音强度和音频的相对强度的数
字化标定值,使得用户可以更加科学直观地感受到所处的听音强度是多少,还可以用于判断当前听音强度是否超出警告范围。
101.请参见图5,图5为本技术实施例所提供的另一种音量调节方法,本实施例提供的音量调节方法可以应用于设备被动调节音量的过程中,本实施例具体可以包括以下操作:
102.s501:采集人耳听觉特征信息;
103.其中,人耳对于不同频率的声音的敏感程度不同,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度。人耳对某一频率的声音敏感程度越高,则越容易在该频率的声音音量较低时识别该声音。例如,小明对125hz音频的声音敏感程度高于对700hz音频的声音敏感程度,当125hz音频的声音强度为25分贝时小明恰好能听见125hz音频,当700hz音频的声音强度为25分贝时小明无法听见700hz音频,在700hz音频的声音强度提高60分贝时小明才能听见700hz音频。
104.s502:若接收到音量调节指令,则根据人耳听觉特征信息确定所述目标音频对应的音量调节参数;
105.其中,音量调节指令可以为用户或其他设备发送的指令,音量调节指令可以包括用于增大音量的指令,也可以包括用于减小音量的指令。相关技术中,在设备受到音量调节指令时,往往直接增大音频的时域信号幅度,音频的各个频域的能量同比例提高,但是由于人耳对不同频率的声音的敏感程度不同,直接调节时域信号幅度可能导致一部分频率的声音恰好能听清楚,但另一部分频率的声音过大。例如对于部分音频,音量设置已经很大了,但由于人耳对不同频率的声音的敏感程度不同此时仍不能听清楚某些细节,此时如果继续增大音量,虽然可以听清楚细节,但是用户会因为部分频率的音量明显过大而感到不舒服。为了解决上述问题,本技术根据人耳听觉特征信息确定目标音频对应的音量调节参数,音量调节参数包括目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关。
106.s503:根据音量调节参数调节目标音频的频域信号幅度。
107.其中,本实施例根据音量调节参数中的每一频率对应的频率幅度变化量调节目标音频的频域信号幅度,以使声音敏感程度较高的频率的能量变化较小、声音敏感程度较低的频率的能量变化较大。通过本实施例的频域信号幅度调节方式,能够着重放大用户不太敏感频段的声音强度,以便用户听清目标音频的全部细节。
108.当用户想要调大音量时,说明目前的声音响度无法保障其听清楚播放的内容。传统的做法是从时域信号的角度出发增大时域信号幅度值。而从频域的角度出发,这种相关技术做法等效于将信号的各个频点的能量都做等幅度的抬升。真实情况可能是,用户只是对某些频段的内容听不清楚。频点的能量都做等幅度的抬升会使得用户对本来已经听得清楚的频段感到响度过大,而不舒服。针对这种情况,本实施例通过获取人耳听觉特征信息确定人耳在多个频率的声音敏感程度,在接收到音量调节指令后从根据人耳听觉特性对目标音频中各个频率的频域信号幅度进行不同程度的调整,以增大人耳不敏感频段的声音强度变化量,减小人耳敏感频段的声音强度变化量。通过本实施例的音量调节方案能够根据人耳听觉特性个性化地调节音量,可以有效避免调节音量过程中为了放大听不清的部分频率的细节导致其他频率的声音强度过大的情况,可以合理调节音量,避免音量过大损伤听力。本实施例的人耳听觉特征信息采集过程简单高效,用户只需要反馈听到与否,而无需手动
调节测试信号的增益,测声音强度由增加变衰减的拐点由用户听觉特征决定,既加快了测试速度,也最大程度的保护了用户耳朵不受损伤。
109.作为对于图5的进一步介绍,本实施例可以通过以下方式确定目标音频对应的音量调节参数:根据所述人耳听觉特征信息确定频率权重值,根据所有频率对应的频率权重值确定所述目标音频中所有频率的频率幅度变化量,并根据所有所述频率的频率幅度变化量生成音量调节参数;其中,所述频率权重值为人耳在目标频率的敏感声音强度与敏感声音强度差的比值,所述敏感声音强度差为第一敏感声音强度与第二敏感声音强度的差,所述第一敏感声音强度为人耳最不敏感频率的敏感声音强度,所述第二敏感声音强度为人耳最敏感频率的敏感声音强度;所述频率权重值与频率幅度变化量正相关。
110.具体的,本实施例可以根据人耳听觉特征信息确定人耳最敏感频率的敏感声音强度h
min
和人耳最不敏感频率的敏感声音强度h
max
,进而利用音量调节公式确定所述目标音频对应的音量调节参数;其中,所述音量调节参数中包括每一频率对应的实际频率幅度变化量δf。
111.其中,所述音量调节公式为δf

为所述音量调节指令对应的目标频率幅度变化量,h
x
为人耳在第x个频率点的敏感声音强度。通过本实施例可以只把用户最不敏感的频点增加音量调节指令对应的声音强度变化量xdb,而最敏感的频点不做任何增加,其余频点的增益值位于(0,x)db二者之间。本实施例提供的结合了听觉特征的音量调节方案,放大的不再是整体时域信号的能量幅度,而是用户听不清楚的细节频段。这种声音调节方法既保障用户可以听清楚所有频段的内容,又避免了时域放大方法不做任何频率区分使得个别敏感频点因为响度过大,造成用户耳朵损伤的情况。
112.请参见图6,图6为本技术实施例所提供的一种人耳听觉特征信息的采集方法的流程图,本实施例是对图5对应该实施例中采集人耳听觉特征信息的进一步介绍,可以将本实施例图5对应的实施例相结合得到进一步的实施方式,本实施例可以包括以下步骤:
113.s601:依次播放单频声音信号,并根据用户反馈信息确定声音敏感度信息;
114.其中,上述单频声音信号可以为听觉测试音频库中的信号,听觉测试音频库中可以存在多个单频声音信号,单频声音信号指只包括某一频率的声音信号。在播放单频声音信号时,用户可以反馈是否能听清该单频声音信号的反馈信息,以便根据用户的反馈信息确定用户对该频段声音信号的频率的敏感程度。用户反馈信息可以包括人耳对所有所述单频声音信号的敏感声音强度,敏感声音强度为用户恰好能听见或恰好听不见单频声音信号时该单频声音信号的声音强度,敏感声音强度与所述声音敏感程度负相关。
115.s602:将所有单频声音信号的频率在等响曲线的声音强度作为标准声音强度;
116.s603:将同一频率对应的所述标准声音强度和所述敏感声音强度进行声音强度对比,根据所述声音强度对比结果确定所述人耳听觉特征信息。
117.本实施例将敏感声音强度与标准声音强度进行对比,得到人耳听觉特征信息。
118.下面通过实际应用中的例子说明将敏感声音强度与标准声音强度进行对比得到人耳听觉特征信息的过程:确定被测试者在31.5hz、63hz、125hz、250hz、500hz、1khz、2khz、4khz、8khz、16khz的敏感声音强度,将上述10个频率对应的敏感声音强度构成的向量earh作为声音敏感度信息。在响度位40phon的等响曲线上,依次取上述10个频点的响度值(即标
准声音强度),记为向量phonh。根据人耳听觉特征计算公式计算测试结果与等响曲线走势的差异,便可得到用户的人耳听觉特征信息hearh。人耳听觉特征计算公式为:
119.hearh=phonh

(earh+mean(phonh-earh));
120.其中,函数mean表示求向量的均值。
121.请参见图7,图7为本技术实施例所提供的一种声音敏感度信息的确定方法的流程图,本实施例是对图6对应实施例的中s601的进一步介绍,可以将本实施例与图6对应的实施例相结合得到进一步的实施方式,本实施例可以包括以下步骤:
122.s701:在听觉测试音频库的单频声音信号中选取并播放目标单频声音信号。
123.其中,本实施例可以在选取目标单频声音信号后,对已选取的目标单频声音信号进行标记,以便在下一次执行s701时选取未被标记的单频声音信号作为目标单频声音信号进行播放。
124.s702:按照从小到大的顺序调整所述目标单频声音信号的声音强度;若接收到第一用户反馈信息,则将所述第一确认信息的接收时刻对应的所述目标单频声音信号的声音强度作为第一参考声音强度。
125.s703:按照从大到小的顺序调整所述目标单频声音信号的声音强度,若接收到第二用户反馈信息,则将所述第二确认信息的接收时刻对应的所述目标单频声音信号的声音强度作为第二参考声音强度。
126.其中,本实施例不限定s702和s703的执行顺序。第一确认信息为:在执行s702按照从小到大的顺序调整目标单频声音信号的声音强度的过程中,用户恰好听见声音时点击已听到的按钮时产生的信息。第二确认信息为:在执行s703按照从大到小的顺序调整目标单频声音信号的声音强度的过程中,用户恰好听不见声音时点击未听到的按钮时产生的信息。
127.s704:根据第一参考声音强度和第二参考声音强度确定人耳对所述目标单频声音信号的敏感声音强度。
128.其中,第一参考声音强度为用户恰好听见目标单频声音信号的声音强度,第二参考声音强度为用户恰好听不见目标单频声音信号的声音强度,因此可以根据第一参考声音强度和第二参考声音强度确定人耳对目标单频声音信号的敏感声音强度。
129.举例说明s701~s704确定敏感声音强度的过程:左右声道依次播放31.5hz、63hz、125hz、250hz、500hz、1khz、2khz、4khz、8khz、16khz的单频声音信号作为测试音频。其中单频声音信号的幅度(即能量大小)呈现从弱到强,再从强到弱的变化趋势,其单位为db。具体的,可以先按照从小到大的顺序调整所述目标单频声音信号的声音强度,再按照从大到小的顺序调整所述目标单频声音信号的声音强度,在测试的前半段,幅度值从弱变强的速度较快,被试者会经历声音从无到有的过程。当刚好开始听到声音时,便要按下“我听到了”按钮;在后半段,幅度值从强变弱的速度较慢一些,被试者会经历声音从有到无的过程。当刚好听不到声音时,便要按下“我听不到了”按钮。其中目标单频声音信号的声音强度变化的规律不局限于线性变化,也可以是指数变化等其他样式。
130.作为一种可行的实施方式,本步骤可以直接将第一参考声音强度和第二参考声音强度的平均值作为人耳对目标单频声音信号的敏感声音强度。
131.作为另一种可行的实施方式,本步骤可以先判断所述第一参考声音强度和第二参
考声音强度的声音强度之差是否在预期误差范围内;若是,则将所述第一参考声音强度和第二参考声音强度的平均值作为人耳对所述目标单频声音信号的敏感声音强度;若否,则重新播放所述目标单频声音信号,并调整所述目标单频声音信号的声音强度,以便根据用户反馈信息确定新的第一参考声音强度和新的第二参考声音强度。上述方式能够在第一参考声音强度和第二参考声音强度相差过大时,重新播放目标单频声音信号并执行s702和s703的相关操作重新确定新的第一参考声音强度和新的第二参考声音强度,减小了测量过程中的误差,提高了声音敏感度信息的准确度。
132.s705:判断是否得到人耳对所有单频声音信号的敏感声音强度;若是,则进入s706;若否,则进入s701。
133.s706:根据人耳对所有单频声音信号的敏感声音强度生成所述声音敏感度信息。
134.本实施例通过从小到大或从大到小调节目标单频声音信号的声音强度,确定用户恰好能听见或恰好听不见单频声音信号时该单频声音信号的声音强度,进而得到用户对每一单频声音信号的敏感声音强度。上述过程通过单频声音信号进行测试可以得到声音敏感度信息,提高了声音敏感度信息的获取效率。
135.作为对于图7对应实施例的进一步介绍,本实施例在s701时可以播放声音强度为0分贝的目标单频声音信号,然后依次执行s702和s703的操作,s702和s703的执行逻辑如下:
136.步骤1:播放声音强度为0分贝的目标单频声音信号。
137.步骤2:在按照从小到大的顺序调整所述目标单频声音信号的声音强度。
138.步骤3:若所述目标单频声音信号的当前声音强度等于测试声音强度最大值,则执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作。
139.步骤4:若剩余声音强度增大值小于预设声音强度增大值,则在将所述目标单频声音信号的声音强度调整至所述测试声音强度最大值之后,执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作。
140.其中,所述剩余声音强度增大值为所述测试声音强度最大值与接收到所述第一用户反馈信息时所述目标单频声音信号的声音强度的差值。
141.步骤5:若剩余声音强度增大值大于预设声音强度增大值,则在将所述目标单频声音信号的声音强度增加所述预设声音强度增大值之后,执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作。
142.举例说明上述步骤3、步骤4和步骤5中关于根据剩余声音强度增大值和预设声音强度增大值如何调整目标单频声音信号的声音强度的过程:
143.请参见图8,图8为本技术实施例所提供的一种声音强度调节示意图,图8中m为测试声音强度最大值,a为用户恰好听见目标单频声音信号的点,b为用户恰好听不见目标单频声音信号的点,图8中横坐标为时间,纵坐标为声音强度。若用户对于目标单频声音信号听到与听不到的声音强度位于n1(n1《m)值处,则声音强度在整个变化过程中,当用户在a点按下“我听到了”按钮时,声音强度再增加预设声音强度增大值和剩余声音强度增大值(即m-n1)中的最小值后便开始下降。这样既可以加快寻找b点的时间,也避免了用户在听到声音后,还继续增加到预设值m处,使得声音响度超出用户的承受范围。若用户对于目标单频声音信号听到与听不到的声音强度位于n2(n2》m)值处,则信号幅度值即便是增加到预设最大值m处,也还是没办法听到。因此当用户一直没有按任何按钮,而且信号幅度值也已经回
落至预设最小值附近时,则认为用户对该频率的声音不太敏感。最终在该频点的测试结果为m,即按照预设最大值为听到与听不到的临界值。
144.具体的,若声音强度最大值为50分贝,预设声音强度增大值为10分贝;在按照从小到大的顺序调整声音强度的过程中,若在30分贝时用户点击已听见按钮生成第一用户反馈信息,本实施例则可以在将声音强度提升至40分贝后执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作;若在45分贝时用户点击已听见按钮生成第一用户反馈信息,本实施例则可以在将声音强度提升至50分贝后执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作;若检测到目标单频声音信号的声音强度达到50分贝,无论是否接受到第一用户反馈信息均执行所述按照从大到小的顺序调整所述目标单频声音信号的声音强度的操作。
145.参见图9,图9为本技术实施例所提供的一种音量调节装置的结构示意图,该音量调节装置包括:
146.噪声能量分布确定模块901,用于获取环境噪声并确定所述环境噪声的噪声能量分布信息;其中,所述噪声能量分布信息包括频率和噪声能量值的对应关系;
147.参考能量值确定模块902,用于根据所述噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值;
148.调节参数确定模块903,用于根据参考能量值对目标音频进行均衡预处理得到信号调节参数;其中,所述信号调节参数包括所述目标音频中每一频率对应的目标频率幅度变化量;
149.幅度调节模块904,用于根据所述信号调节参数调节所述目标音频的频域信号幅度。
150.本实施例在获取环境噪声之后确定环境噪声的噪声能量分布信息,噪声能量分布信息中包括环境噪声中每一频率的噪声能量值。本实施例根据噪声能量分布信息选取n个目标频率的对应的噪声能量值作为参考能量值,进而根据参考能量值对目标音频进行均衡预处理得到信号调节参数。由于信号调节参数包括目标音频中每一频率对应的目标频率幅度变化量,利用信号调节参数调节目标音频的频域信号幅度时,能够使目标音频中每一频率对应的频率幅度变化量与同一频率的噪声能量值相关。通过上述调节方法可以使目标音频在噪声能量值较大的频域调整较大的能量值,在噪声能量值较小的频域调整较小的能量值,从而使得目标音频相较于环境噪声的能量在各个频带内均有抬升。因此,本实施例提供的音量调节方法根据环境噪声分别对目标音频的各个频率的频域信号幅度进行调整,进而可以合理调节音量,降低环境噪声对音频收听效果的影响。
151.进一步的,幅度调节模块904包括:
152.幅度变化量确定单元,用于根据所述信号调节参数确定当前时刻播放所述目标音频的目标频率幅度变化量;
153.慢调节单元,用于确定当前时刻播放所述目标音频的实际频率幅度变化量,并根据所述当前时刻播放所述目标音频的实际频率幅度变化量调节所述目标音频的频域信号幅度;其中,所述当前时刻播放所述目标音频的实际频率幅度变化量在幅度变化量区间内;所述幅度变化量区间为开区间,所述幅度变化量区间的端点值为所述上一时刻播放所述目标音频的实际频率幅度变化量,以及当前时刻播放所述目标音频的目标频率幅度变化量。
154.进一步的,参考能量值确定模块902包括:
155.归一化单元,用于对所述噪声能量分布信息中的噪声能量值归一化映射至目标区间;
156.能量值选取单元,用于根据归一化映射后的噪声能量分布信息,选取n个目标频率的对应的噪声能量值作为参考能量值。
157.进一步的,还包括:
158.声音拾取模块,用于在根据所述噪声能量分布信息调节目标音频的频域信号幅度之后,利用声音拾取装置拾取播放所述目标音频时的总声音数据;其中,所述总声音数据包括所述目标音频的声音和环境噪声;
159.音量调节模块,用于判断所述总声音数据的声音强度是否大于额定分贝值;若是,则执行第一预设操作和/或第二预设操作;其中,所述第一预设操作为生成音量过大的提示信息;所述第二预设操作为降低所述目标音频的频域信号幅度。
160.进一步的,噪声能量分布确定模块901用于计算所述环境噪声的噪声频谱能量;还用于对所述噪声频谱能量执行a计权的反向数值加权操作得到所述环境噪声的噪声能量分布信息。
161.进一步的,还包括:
162.听觉特征采集模块,用于采集人耳听觉特征信息;其中,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度;
163.调节参数确定模块,用于若接收到音量调节指令,则根据人耳听觉特征信息确定所述目标音频对应的音量调节参数;其中,所述音量调节参数包括所述目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关;
164.音量调节模块,用于根据所述音量调节参数调节所述目标音频的频域信号幅度。
165.进一步的,听觉特征采集模块包括:
166.敏感度信息确定单元,用于依次播放单频声音信号,并根据用户反馈信息确定声音敏感度信息;其中,所述声音敏感度信息包括人耳对所有所述单频声音信号的敏感声音强度,所述敏感声音强度与所述声音敏感程度负相关;
167.标准音强确定单元,用于将所有所述单频声音信号的频率在等响曲线的声音强度作为标准声音强度;
168.对比单元,用于将同一频率对应的所述标准声音强度和所述敏感声音强度进行声音强度对比,根据所述声音强度对比结果确定所述人耳听觉特征信息。
169.进一步的,敏感度信息确定单元用于若所述第一参考声音强度和第二参考声音强度的声音强度之差在预期误差范围内,则将所述第一参考声音强度和第二参考声音强度的平均值作为人耳对所述目标单频声音信号的敏感声音强度;其中,所述第一参考声音强度为在第一过程中接收到用户反馈信息时对应的声音强度,所述第二参考声音强度为在第二过程中接收到用户反馈信息时对应的声音强度,所述第一过程为按照从小到大的顺序调整所述单频声音信号的声音强度的过程,所述第二过程为按照从大到小的顺序调整所述单频声音信号的声音强度的过程;还用于若所述第一参考声音强度和第二参考声音强度的声音强度之差不在预期误差范围内,则重新播放所述单频声音信号,并调整所述单频声音信号的声音强度,以便根据用户反馈信息确定新的第一参考声音强度和新的第二参考声音强
度。
170.进一步的,调节参数确定模块用于根据所述人耳听觉特征信息确定频率权重值;其中,所述频率权重值为人耳在目标频率的敏感声音强度与敏感声音强度差的比值,所述敏感声音强度差为第一敏感声音强度与第二敏感声音强度的差,所述第一敏感声音强度为人耳最不敏感频率的敏感声音强度,所述第二敏感声音强度为人耳最敏感频率的敏感声音强度;还用于根据所有频率对应的频率权重值确定所述目标音频中所有频率的频率幅度变化量,并根据所有所述频率的频率幅度变化量生成音量调节参数;其中,所述频率权重值与频率幅度变化量正相关。
171.参见图10,图10为本技术实施例所提供的另一种音量调节装置的结构示意图,该音量调节装置包括:
172.听觉特征采集模块1001,用于采集人耳听觉特征信息;其中,所述人耳听觉特征信息用于描述人耳在多个频率的声音敏感程度;
173.调节参数确定模块1002,用于若接收到音量调节指令,则根据人耳听觉特征信息确定目标音频对应的音量调节参数;其中,所述音量调节参数包括所述目标音频中每一频率对应的频率幅度变化量,所述频率幅度变化量与同一频率的声音敏感程度负相关;
174.音量调节模块1003,用于根据所述音量调节参数调节所述目标音频的频域信号幅度。
175.本实施例根据音量调节参数中的每一频率对应的频率幅度变化量调节目标音频的频域信号幅度,以使声音敏感程度较高的频率的能量变化较小、声音敏感程度较低的频率的能量变化较大。通过本实施例的频域信号幅度调节方式,能够着重放大用户不太敏感频段的声音强度,以便用户听清目标音频的全部细节。
176.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
177.本技术还提供了一种电子设备,参见图11,本技术实施例提供的一种电子设备的结构图,如图11所示,可以包括处理器1110和存储器1120。
178.其中,处理器1110可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1110可以采用dsp(digitalsignalprocessing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1110也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(centralprocessing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1110可以在集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1110还可以包括ai(artificialintelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
179.存储器1120可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1120还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器1120至少用于存储以下计算机程序1121,其中,该计算机程序被处理器1110加载并执行之后,能够实现前述任一实施例公开
的由电子设备侧执行的音量调节方法中的相关步骤。另外,存储器1120所存储的资源还可以包括操作系统1122和数据1123等,存储方式可以是短暂存储或者永久存储。其中,操作系统1122可以包括windows、ios、安卓等。
180.在一些实施例中,电子设备还可包括有显示屏1130、输入输出接口1140、通信接口1150、传感器1160、电源1170以及通信总线1180。
181.当然,图11所示的电子设备的结构并不构成对本技术实施例中电子设备的限定,在实际应用中电子设备可以包括比图11所示的更多或更少的部件,或者组合某些部件。
182.在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任一实施例电子设备所执行的音量调节方法的步骤。
183.说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。
184.还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1