一种音量调整方法、装置和设备与流程

文档序号:11410419阅读:168来源:国知局
一种音量调整方法、装置和设备与流程
本发明实施例涉及声音控制技术,尤其涉及一种音量调整方法、装置和设备。
背景技术
:对于带有麦克风和扬声器的智能硬件设备,其操作界面上一般设置有控制扬声器外放音量大小的装置。通常情况下,扬声器的外放音量由设备的硬件设计和系统软件设计来决定,用户可根据自身需求进行音量调节。但是,当智能硬件设备在嘈杂的噪声环境中时,例如在人流汹涌的百货商场中,专卖柜台使用智能硬件设备来进行产品功能演示,常常会出现两种影响用户体验的情况。第一,音量控制装置已经调节到最大音量,但是在外部噪声干扰的情况下,智能硬件设备的外放声音仍旧难以听清;第二,音量控制装置调节到最大音量时,外放声音虽然可以抵抗外部的恶劣噪声影响,使得用户可以听清,但是当外部环境噪声变弱或消失时,外放音量又会显得过于吵闹,这时,就需要经常手动调节设备音量来匹配外部环境噪声的经常变化,以获取较佳的用户体验,操作比较麻烦。技术实现要素:本发明提供一种音量调整方法、装置和设备,以实现智能硬件设备的外放音量能够更智能的匹配外部嘈杂环境,提升用户体验。第一方面,本发明实施例提供了一种音量调整方法,包括:通过麦克风获取环境噪声;若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整;依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。可选地,依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子包括:依据待播放音频信号的音频频率特性及预设频段划分规则,确定所述待播放音频信号的至少一个频段,作为待调整频段;依据所述待调整频段及预设频段之间的频段特性对应关系,调整所述待调整频段的音频信号的音量增益因子。可选地,在所述若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整之后,还包括:判断所述待播放音频信号的信号幅值是否小于预设的数字信号门限值;若是,则依据所述环境噪声的音量及预先确定的噪声等级划分标准,确定环境噪声等级;依据所述环境噪声等级及预设的音量增益因子的映射关系,调整所述待播放音频信号的至少一个所述频段的音量增益因子。可选地,依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子包括:依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。进一步地,依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子包括:若所述噪声频率特性为中低频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为全频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调,对低频段的音频信号的音量增益因子进行下调或保持不变;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为全频,则对所述待播放音频信号中的全频段的音量增益因子进行上调。可选地,依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子包括:当所述待播放音频信号为人声,所述噪声频率特性为中低频时,对所述人声中的中低频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为纯音乐,所述噪声频率特性为中低频时,对所述纯音乐中的中高频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为流行乐,所述噪声频率特性为中低频时,对所述流行乐中的中高频段的音频信号的音量增益因子进行上调,中低频段的音频信号的音量增益因子保持不变,低频段及高频段的音频信号的音量增益因子进行下调;当所述待播放音频信号为摇滚乐,所述噪声频率特性为中低频时,对所述摇滚乐中的中低频段的音频信号的音量增益因子进行上调。第二方面,本发明实施例还提供了一种音量调整装置,该装置包括:环境噪声获取模块,用于通过麦克风获取环境噪声;增益调整触发模块,用于若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整;第一增益因子调整模块,用于依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;增益调整模块,用于采用各频段的音量增益因子对所述音频信号进行音量增益调整。可选地,上述第一增益因子调整模块包括:待调整频段确定子模块,用于依据待播放音频信号的音频频率特性及预设频段划分规则,确定所述待播放音频信号的至少一个频段,作为待调整频段;第一增益因子调整子模块,用于依据所述待调整频段及预设频段之间的频段特性对应关系,调整所述待调整频段的音频信号的音量增益因子。可选地,在上述装置的基础上,该装置还包括:第二增益因子调整模块,所述第二增益因子调整模块包括:信号幅值判断子模块,用于在所述若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整之后,判断所述待播放音频信号的信号幅值是否小于预设的数字信号门限值;噪声等级确定子模块,用于依据所述环境噪声的音量及预先确定的噪声等级划分标准,确定环境噪声等级;第二增益因子调整子模块,用于依据所述环境噪声等级及预设的信号增益因子的映射关系,调整所述待播放音频信号的至少一个所述频段的增益因子。可选地,上述第一增益因子调整模块还包括:第三增益因子调整子模块,用于依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。进一步地,上述第三增益因子调整子模块具体用于:若所述噪声频率特性为中低频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为全频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调,对低频段的音频信号的音量增益因子进行下调或保持不变;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为全频,则对所述待播放音频信号中的全频段的音量增益因子进行上调。可选地,上述第三增益因子调整子模块还具体用于:当所述待播放音频信号为人声,所述噪声频率特性为中低频时,对所述人声中的中低频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为纯音乐,所述噪声频率特性为中低频时,对所述纯音乐中的中高频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为流行乐,所述噪声频率特性为中低频时,对所述流行乐中的中高频段的音频信号的音量增益因子进行上调,中低频段的音频信号的音量增益因子保持不变,低频段及高频段的音频信号的音量增益因子进行下调;当所述待播放音频信号为摇滚乐,所述噪声频率特性为中低频时,对所述摇滚乐中的中低频段的音频信号的音量增益因子进行上调。第三方面,本发明实施例还提供了一种设备,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;麦克风,用于采集环境噪声;扬声器,用于播放媒体信息;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例中的任一种音量调整方法。本发明实施例通过麦克风获取环境噪声;在所述环境噪声的音量达到预设音量阈值时,触发音量增益调整;依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,达到了智能硬件设备的外放音量能够更智能地匹配外部嘈杂环境的效果,提升了用户体验。附图说明图1是本发明实施例一中的一种音量调整方法的流程图;图2是本发明实施例一中的智能硬件设备进行音频信号外放的过程示意图;图3是本发明实施例二中的一种音量调整方法的流程图;图4是本发明实施例二中的针对流行音乐进行音量增益调整前后的时域信号结果示意图;图5是本发明实施例二中的针对流行音乐进行音量增益调整前后的频率响应曲线对比图;图6是本发明实施例三中的一种音量调整方法的流程图;图7是本发明实施例三中的基于环境噪声特性进行音量增益调整的时域信号结果示意图;图8是本发明实施例三中的进行音量增益调整方案选择的时域信号示例图;图9是本发明实施例四中的一种音量调整方法的流程图;图10是本发明实施例五中的一种音量调整装置的结构示意图;图11是本发明实施例六中的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。实施例一图1为本发明实施例一提供的一种音量调整方法的流程图,本实施例可适用于在嘈杂的噪声环境中进行音频外放的情况,该方法可以由音量调整装置来执行,该装置可以由软件和/或硬件来实现,通常可配置于具有拾音功能和外放媒体信息功能的设备中,例如典型的是具有麦克风和扬声器的智能硬件设备。参见图2,本发明实施例中的智能硬件设备200首先通过麦克风201捕获设备所处环境的外部环境噪声21,获得环境噪声的模拟信号22,该模拟信号12经过模数转换器202,转换为数字噪声信号23。之后,音量调整装置203对该数字噪声信号23进行噪声检测与估计处理,以获得环境噪声的音量、环境噪声等级或环境噪声频率特性中的至少一项,作为噪声估计结果24;并将获得的噪声估计结果24与待播放音频信号25作为输入信号,对待播放音频信号25进行音量增益调整处理,获得调整后的音频信号,即目标音频信号26。目标音频信号26再经过数模转换器204转换为模拟目标音频信号27,并通过扬声器205将目标音频28播放到外部环境中。参见图1,本实施例中的音量调整方法具体包括如下步骤:s110、通过麦克风获取环境噪声。利用设备的麦克风进行拾音,获得环境噪声。应当说明的是,这里的环境噪声指的是设备所在位置的大范围内的环境噪声音,不包含距离设备较近的人的语音,具体实施过程中,可以通过环境噪声的过滤方式,将距离设别较近的人声过滤掉,获取最终的环境噪声。s120、若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整。其中,预设音量阈值指的是预先设定的噪声音量阈值,其是判断噪声的音量是否达到可以影响到设备外放音频的收听效果的音量分界值。该预设音量阈值可以设定为通常的“安静环境”的声压级,比如40分贝(db),也可以根据实际应用情形进行自定义设定,此处不做限制。对s110中获得的环境噪声进行噪声能量统计,获得噪声能量统计数据,比如可以是环境噪声的音量大小、对噪声能量进行等级划分的噪声等级或噪声频率特性等。然后,将获得的环境噪声音量与预设音量阈值进行比较,当环境噪声音量大于预设音量阈值时,说明此时的环境噪声会影响到待播放音频信号的外放收听效果,就触发音量增益调整,以对待播放音频信号进行音量增益调整,即触发执行s130。反之,当环境噪声音量小于预设音量阈值时,说明此时的环境噪声并不会影响待播放音频信号的外放收听效果,就不触发音量增益调整,不对待播放音频信号进行额外的处理。应当说明的是,本实施例中的噪声能量统计方法只要可以获得噪声能量统计数据即可,其可以是周期性均方根(rootmeamsquare,rms)统计方法,也可以是其他噪声能量统计方法,此处不做限定。s130、依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。在确定需要对待播放音频信号进行音量增益调整之后,对待播放音频信号进行分析,获得其音频频率特性。根据该音频频率特性,将待播放音频信号进行至少一个频段的划分,之后可以根据设定的音量增益因子调整规则,确定上述至少一个频段的音频信号的音量增益因子。应当理解的是,本实施例中对上述待播放音频信号还进行了频段划分,可根据实际需求进行频段划分,例如优选是将区别于环境噪声的频段进行单独处理,或将待播放音频中需要重点突出的频段进行单独处理。s140、采用各频段的音量增益因子对所述音频信号进行音量增益调整。在获得了至少一个频段的音量增益因子之后,就可以利用各个频段的音量增益因子对相应频段的待播放音频信号进行音量增益调整,以使得该待播放音频信号能够更好地匹配设备所在的外部嘈杂环境。比如将各频段的音频信号与对应的音量增益因子相乘,确定出该音频信号进行音量增益调整后的输出音频信号,即目标音频信号。本实施例的技术方案,通过麦克风获取环境噪声;在所述环境噪声的音量达到预设音量阈值时,触发音量增益调整;依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,达到了智能硬件设备的外放音量能够更智能地匹配外部嘈杂环境的效果,提升了用户体验。实施例二图3为本发明实施例二提供的一种音量调整方法的流程图,本实施例在上述实施例的基础上,对“依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子”进行了进一步优化。其中,与上述实施例相同或相应的术语的解释,在本实施例中不再赘述。下面结合图3对本发明实施例二提供的音量调整方法进行说明,本实施例的方法包括:s210、通过麦克风获取环境噪声。s220、若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整。s230、依据待播放音频信号的音频频率特性及预设频段划分规则,确定所述待播放音频信号的至少一个频段,作为待调整频段。其中,预设频段划分规则指的是预先设定的进行频段划分的规则,其可以是根据人耳的听觉感知频率敏感度进行频段划分,也可以是根据音乐领域的频段划分规则进行划分,还可以是自定义的频段划分规则,对此不做具体限定。示例性地,为了更好地匹配人耳听觉感受,可以采用基于人耳的听觉感知频率敏感度进行频段划分的频段划分规则,具体的频段划分规则见表1。表1基于人耳的听觉感知频率敏感度的频段划分规则具体地,根据待播放音频信号的频率特性,按照表1中的预设频段划分规则,对待播放音频信号进行频段划分,确定出待播放音频信号的至少一个频段,作为待调整频段。s240、依据所述待调整频段及预设频段之间的频段特性对应关系,调整所述待调整频段的音频信号的音量增益因子。其中,预设频段是根据预设频段划分规则确定的频段,比如表1中的频段编号1-5的频段即为基于人耳的听觉感知频率敏感度的频段划分规则对应的预设频段。确定出待调整频段之后,根据待调整频段的频段特性与预设频段的频段特性之间的对应关系,确定出待调整频段中每一个频段的音频信号的音量增益因子。需要说明的是,调整每一个频段的音量增益因子的过程中,可以在各频段之间增加频段的划分数量,或者将每个频段的音量增益因子设置为分段式的数值,或者采用其他的渐变式音量增益因子调整方式,以便保证各频段音频信号音量增益调整的连续性和平滑性。比如,待播放音频信号为流行音乐,s230中按照表1的频段划分规则确定出该待播放音频信号的待调整频段对应于表1中频段编号为1-5的频段。待调整频段的频段特性表明其中需要突出人声及乐器所在的频段,对照表1中预设频段的频率特性,可知,需要增强频段编号为3和4(具体频率为4k~16khz)的频段的音频信号,即需要上调4k~16khz频率的音频信号的音量增益因子;频段编号为2(具体频率为500~4khz)的频段的音量增益因子可以保持不变;而对于频段编号为1(具体频率为小于500hz)和5(具体频率为大于16khz)的频段的音量增益因子则需要下调,以使得待播放音频信号稳定、清晰。应当说明的是,上述过程中是以音乐类型来确定待播放音频信号的频率特性的。除此之外,还可以采用诸如机器学习的智能算法来确定待播放音频信号的频率特性,此处只是作为一个举例进行说明,对此不做具体限定。s250、采用各频段的音量增益因子对所述音频信号进行音量增益调整。这里仍然以上述待播放音频信号为流行音乐为例,对本实施例中的音量调整方法进行说明。参见图4,假设环境噪声410的音量持续较大,即对于待播放音频信号420的整个播放时间,外部环境噪声均达到了触发音量增益调整的水平。利用本实施例中的音量调整方法对待播放音频信号420进行音量增益调整,获得目标音频信号430。由图4中的时域信号波形图可以看出,目标音频信号430的时域信号幅值和待播放音频信号420的时域信号幅值相比,并没有太多差异,也不存在因信号幅值达到设备最大信号幅值41及设备最小信号幅值42而导致的削峰现象。参见图5,将目标音频信号430的目标频率响应曲线530与待播放音频信号420的原始频率响应曲线520进行对比,可以看出,目标音频信号430对频率小于500hz的低频频段信号做了适当的抑制;对频率为500~4khz的中频频段信号保持基本不变;对频率为4k~16khz的中高频频段信号做了大幅的增强,增强幅度约为8~15db;对频率大于16khz的高频频段信号同样做了增强,但是平滑地逐步减小增强幅度;对频率大于19.5khz的超高频频段信号做了适当的抑制,抑制幅度约为4~6db。经过本实施例中的音量增益调整之后的目标音频信号430的主观听觉会感觉更尖锐、明亮,在噪声环境下更易感知,用户的整体体验会大大优于待播放音频信号420。本实施例的技术方案,通过麦克风获取环境噪声;在所述环境噪声的音量达到预设音量阈值时,触发音量增益调整;依据待播放音频信号的音频频率特性及预设频段划分规则,确定所述待播放音频信号的至少一个频段,作为待调整频段;并依据所述待调整频段及预设频段之间的频段特性对应关系,调整所述待调整频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,实现了基于待播放音频信号不同频段的频率特性进行音量增益调整,使得智能硬件设备的外放音量能够更具适应性地、更智能地匹配外部嘈杂环境的效果,进一步提升了用户体验。实施例三图6为本发明实施例三提供的一种音量调整方法的流程图,本实施例在上述实施例的基础上,增加了基于环境噪声等级进行音量增益因子调整的过程。其中,与上述实施例相同或相应的术语的解释,在本实施例中不再赘述。下面结合图6对本发明实施例三提供的音量调整方法进行说明,本实施例的方法包括:s310、通过麦克风获取环境噪声。s320、若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整。s330、判断所述待播放音频信号的信号幅值是否小于预设的数字信号门限值。其中,预设的数字信号门限值指的是预先设定的数字信号的最大幅值及最小幅值,用于判断是否能够根据噪声音量来调整音量增益因子,例如可以根据设备能够响应的最大信号幅值和最小信号幅值来设定。由于超过设备最大/最小信号幅值的信号幅值会被滤除掉,进而会影响外放音频的播放音质和听觉效果,所以为了保证目标音频信号的正常播放,可以将预设的数字信号门限值设定为小于设备的最大及最小信号幅值绝对值的数值,具体的数值可以自行设定。在s320确定触发了音量增益调整之后,可以分析待播放音频信号的信号幅值,并将该信号幅值与预设的数字信号门限值进行比较。如果信号幅值等于或者大于预设的数字信号门限值,那么执行s360。如果信号幅值小于预设的数字信号门限值,那么执行s340。s340、依据所述环境噪声的音量及预先确定的噪声等级划分标准,确定环境噪声等级。其中,预先确定的噪声等级划分标准指的是根据噪声音量进行噪声等级划分的标准,其可以包含噪声等级划分的依据以及划分数量,可以是经验设定的划分标准,也可以是利用诸如机器学习的智能算法自适应设定的划分标准,可以根据具体的应用场景自行设定。上述自适应设定的划分标准需要设备先在相应的外部环境噪声中学习或训练一段时间(例如30-60分钟),并分析这段时间之内所采集的外部环境噪声的噪声特性,依据该噪声特性来确定噪声等级划分标准。应当注意的是,对于噪声等级的划分数量,需要根据设备实际所处的使用场景以及环境噪声特性来具体选择。等级划分数量越多,音量增益调整越频繁,外放目标音频音量的变化也就越平滑,但音量的增强和减弱的变化会显得比较缓慢、不太及时;反之,等级划分数量越少,音量增益调整越稀少,音量变化会响应非常迅速,但是外放目标音频音量的变化会有突变的感觉。例如,当设备处于室内商场等噪声类型和噪声等级基本上恒定不变或变化非常缓慢的类似场所时,由于此类场所的噪声不会突发出现或者突然消失,所以可以将噪声等级划分数量设置的多一些,使得外放音量的调整显得平滑。而当设备处于室外场所时,由于此类场所会有一些高强度的突发噪声,例如驶过的车辆等,所以可以将噪声等级划分数量设置的少一些,使得外放声音的可以随突发噪声的变化而快速响应。当强烈噪声突然发生时,外放音频音量随之提升,使得用户不至于在噪声突发时听不清外放音频内容而丢失收听信息;当强烈噪声突然消失时,外放音频音量随之减弱,使得用户不会感觉在噪声已消失后转为较为安静的环境下仍然觉得外放音频过于响亮刺耳。具体地,假设预先确定的噪声等级划分标准依据经验设定,如表2所示。依据表2中的噪声等级划分标准及s320中的环境噪声音量,将环境噪声划分为对应的4个等级,即确定环境噪声等级,记为en,其中n代表对环境噪声的检测周期,每一周期的检测即得到一个环境噪声等级e。本实施例中是实时连续地对环境噪声进行检测,并同步地对待播放音频信号进行音量增益调整。表2经验设定的噪声等级划分标准及音量增益因子对照表噪声等级en噪声能量/db环境噪声类型音量增益因子α0<40安静环境1.0140~60弱噪声环境2.8260~80中等噪声环境3.73>80强噪声环境5.5s350、依据所述环境噪声等级及预设的音量增益因子的映射关系,调整所述待播放音频信号的至少一个所述频段的音量增益因子。其中,预设的音量增益因子的映射关系指的是预先设定的音量增益因子与环境噪声等级之间的一对一映的射关系,其可以是如表2所示的预先建立的查找表,也可以是预先建立的某种映射关系式。具体地,可以依据表2中的预设的音量增益因子的映射关系,确定出在s310的环境噪声影响下,待播放音频信号对应的每个频段的音量增益因子αj(j∈[0,3]),之后执行s370。其中,α0的值恒等于1,意味着在环境噪声等级为0(安静环境下)时,待播放音频信号不需要进行音量增益调整;其它的αj(j∈(0,3])的值均是大于1.0的数值,其必定满足α1<α2<…<αj,代表着环境噪声等级越高,待播放音频信号的音量增益调整越大。s360、依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。基于待播放音频信号的音频频率特性来调整待播放音频信号的每个频段的音量增益因子,之后执行s370。s370、采用各频段的音量增益因子对所述音频信号进行音量增益调整。以实际待播放音频信号的处理来举例,对s340及s350组成的音量增益因子调整方案(记为方案一)进行分析对比。参见图7,环境噪声710是在变化的,依据其能量大小的变化可划分为7个噪声区间。然后,以上述表2中的噪声等级划分标准及音量增益因子映射关系,对环境噪声710进行等级划分,并得到待播放音频信号对应的7个频段的音量增益因子,如表3所示。表3图7中对应的7个噪声区间的相关分析和计算参数利用表3中的音量增益因子对待播放音频信号720进行音量增益调整,获得目标音频信号730。从图7中可以看出,待播放音频信号720基本是保持恒定不变的能量水平,而经过方案一的音量增益调整之后,形成了具有不同能量变化的目标音频信号730。由目标音频信号730的时域波形图可见,在强噪声环境下,经过方案一处理之后的目标音频的增益改善非常明显,使得其音量增大,从而能够在恶劣噪声的影响下令用户可以听清设备的外放目标音频。需要说明的是,上述两种音量增益因子调整方案,即方案一和s360的音量增益因子调整方案(记为方案二),既可以单独使用,也可以结合使用,在结合使用时,方案一和方案二的先后使用顺序不受约束。也就是说,本实施例中,可以不执行s360;或者不执行s340和s350;或者执行所有步骤,但是执行顺序可以按照上述步骤的顺序,也可以与上述步骤顺序相反。上述都可以根据实际应用情况自行选择设定,自行选择设定的整体原则是保证处理后信号能够在噪声环境下更易感知,且无严重影响体验的失真(如削峰等异常现象)。举例而言,参见图8,当待播放音频信号820本身就具有较高的能量幅值时,其时域信号幅值已经非常接近或者达到预设的数字信号门限值81。在图中的外部环境噪声信号810的影响下,利用方案一处理得到目标音频信号830。对于第一段环境噪声信号811,目标音频信号830的第一段目标音频信号831在音量增益调整后会有削峰现象;而对于更恶劣的第二段环境噪声信号812,目标音频信号830的第二段目标音频信号832在音量增益调整后就会产生更加严重的削峰现象。削峰之后的音频信号会产生破音等效果,严重影响了音质和听觉体验。因此对于类似的原始音频信号幅值就接近预设的数字信号门限值81的待播放音频信号,并不适用方案一来处理,而是要采用方案二来处理。本实施例的技术方案,通过麦克风获取环境噪声;在所述环境噪声的音量达到预设音量阈值时,触发音量增益调整;在待播放音频信号的信号幅值小于预设的数字信号门限值时,依据所述环境噪声的音量及预先确定的噪声等级划分标准,确定环境噪声等级,并依据所述环境噪声等级及预设的音量增益因子的映射关系,调整所述待播放音频信号的至少一个所述频段的音量增益因子;和/或,依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,能够自适应地根据环境噪声特性和/或待播放音频信号频率特性进行待播放音频信号的音量增益调整,使得智能硬件设备的外放音量能够更智能地匹配外部嘈杂环境的效果,进一步提升了用户体验。实施例四图9为本发明实施例四提供的一种音量调整方法的流程图,本实施例在上述实施例的基础上,对“依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子”进行了进一步优化。其中,与上述实施例相同或相应的术语的解释,在本实施例中不再赘述。下面结合图9对本发明实施例四提供的音量调整方法进行说明,本实施例的方法包括:s410、通过麦克风获取环境噪声。s420、若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整。s430、依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。由于环境噪声的扩散效果,使得麦克风获取的环境噪声基本为白噪声(即为中低频段),所以在上述任意实施例中,对于环境噪声的噪声频率特性都默认为中低频段,而没有进行特殊考虑。但是为了更加精准化地进行音量增益调整,本实施例中对环境噪声的噪声频率特性进行考量,并将环境噪声的噪声频率特性及待播放音频信号的音频频率特性结合,进行综合分析,以此分析结果来调整待播放音频信号中至少一个频段的音频信号的音量增益因子。示例性地,上述过程可以为:若所述噪声频率特性为中低频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为全频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调,对低频段的音频信号的音量增益因子进行下调或保持不变;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为全频,则对所述待播放音频信号中的全频段的音量增益因子进行上调。上述情况可以归纳为表4所示的内容。表4基于噪声频率特性及音频频率特性进行音量增益因子调整方案示例性地,针对一些具体的应用示例,比如不同的待播放音频信号的类型,上述过程可以为:当所述待播放音频信号为人声,所述噪声频率特性为中低频时,对所述人声中的中低频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为纯音乐,所述噪声频率特性为中低频时,对所述纯音乐中的中高频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为流行乐,所述噪声频率特性为中低频时,对所述流行乐中的中高频段的音频信号的音量增益因子进行上调,中低频段的音频信号的音量增益因子保持不变,低频段及高频段的音频信号的音量增益因子进行下调;当所述待播放音频信号为摇滚乐,所述噪声频率特性为中低频时,对所述摇滚乐中的中低频段的音频信号的音量增益因子进行上调。具体地,根据表1中频段特性的描述可知,人声的频率特性主要集中在300-8khz的频段,即中低频频段,所以当待播放音频信号为纯人声时,则需要将中低频段的音频信号的音量增益因子进行上调,以此来形成音量的对比。纯音乐主要是多种乐器音的组合,其频率特性主要集中在8k-16khz的频段,即中高频频段,所以当待播放音频信号为纯音乐时,则需要将中高频段的音频信号的音量增益因子进行上调,以此来形成音量的对比。流行乐主要以人声及乐器为主,其频率特性是全频段的,为了突出人声及乐器的声音,可以将其中高频段的音频信号的音量增益因子进行上调,中低频段的音频信号的音量增益因子保持不变,低频段及高频段的音频信号的音量增益因子进行下调。而摇滚乐中会有凸显节奏感的重低音乐器,那么需要对其中低频段的音频信号的音量增益因子进行上调,以此来突出其节奏感。s440、采用各频段的音量增益因子对所述音频信号进行音量增益调整。本实施例的技术方案,通过麦克风获取环境噪声;在所述环境噪声的音量达到预设音量阈值时,触发音量增益调整;依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,能够综合考虑环境噪声与待播放音频信号的频率特性,使得智能硬件设备的外放音量能够更精准、更智能地匹配外部嘈杂环境,获得较好的用户体验。以下是本发明实施例提供的音量调整装置的实施例,该装置与上述各实施例的音量调整方法属于同一个发明构思,在音量调整装置的实施例中未详尽描述的细节内容,可以参考上述音量调整方法的实施例。实施例五图10为本实施例五提供的一种音量调整装置的结构示意图,该装置具体包括:环境噪声获取模块1010,用于通过麦克风获取环境噪声;增益调整触发模块1020,用于若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整;第一增益因子调整模块1030,用于依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;增益调整模块1040,用于采用各频段的音量增益因子对所述音频信号进行音量增益调整。可选地,上述第一增益因子调整模块1030包括:待调整频段确定子模块,用于依据待播放音频信号的音频频率特性及预设频段划分规则,确定所述待播放音频信号的至少一个频段,作为待调整频段;第一增益因子调整子模块,用于依据所述待调整频段及预设频段之间的频段特性对应关系,调整所述待调整频段的音频信号的音量增益因子。可选地,在上述装置的基础上,该装置还包括:第二增益因子调整模块,所述第二增益因子调整模块包括:信号幅值判断子模块,用于在所述若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整之后,判断所述待播放音频信号的信号幅值是否小于预设的数字信号门限值;噪声等级确定子模块,用于依据所述环境噪声的音量及预先确定的噪声等级划分标准,确定环境噪声等级;第二增益因子调整子模块,用于依据所述环境噪声等级及预设的信号增益因子的映射关系,调整所述待播放音频信号的至少一个所述频段的增益因子。可选地,上述第一增益因子调整模块1030还包括:第三增益因子调整子模块,用于依据所述环境噪声的噪声频率特性及待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子。进一步地,上述第三增益因子调整子模块具体用于:若所述噪声频率特性为中低频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中低频,且所述音频频率特性为全频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调,对低频段的音频信号的音量增益因子进行下调或保持不变;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中低频,则对所述待播放音频信号中的中低频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为中高频,则对所述待播放音频信号中的中高频段的音频信号的音量增益因子进行上调;若所述噪声频率特性为中高频或全频,且所述音频频率特性为全频,则对所述待播放音频信号中的全频段的音量增益因子进行上调。可选地,上述第三增益因子调整子模块还具体用于:当所述待播放音频信号为人声,所述噪声频率特性为中低频时,对所述人声中的中低频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为纯音乐,所述噪声频率特性为中低频时,对所述纯音乐中的中高频段的音频信号的音量增益因子进行上调;当所述待播放音频信号为流行乐,所述噪声频率特性为中低频时,对所述流行乐中的中高频段的音频信号的音量增益因子进行上调,中低频段的音频信号的音量增益因子保持不变,低频段及高频段的音频信号的音量增益因子进行下调;当所述待播放音频信号为摇滚乐,所述噪声频率特性为中低频时,对所述摇滚乐中的中低频段的音频信号的音量增益因子进行上调。通过本发明实施例五的一种音量调整装置,解决了在外部嘈杂环境中智能硬件设备的外放音量调整不够自动化、智能化的问题,达到了智能硬件设备的外放音量能够更智能地匹配外部嘈杂环境的效果,提升了用户体验。本发明实施例所提供的音量调整装置可执行本发明任意实施例所提供的音量调整方法,具备执行方法相应的功能模块和有益效果。值得注意的是,上述音量调整装置的实施例中,所包括的各个模块和子模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。实施例六图11为本发明实施例六提供的一种设备的结构示意图。本发明实施例提供了一种设备,其包括:一个或多个处理器1110;存储装置1120,用于存储一个或多个程序;麦克风1130,用于采集环境噪声;扬声器1140,用于播放媒体信息;当所述一个或多个程序被所述一个或多个处理器1110执行,使得所述一个或多个处理器1110实现本发明实施例所提供的音量调整方法,包括:通过麦克风获取环境噪声;若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整;依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。当然,本领域技术人员可以理解,处理器1110还可以实现本发明任意实施例所提供的音量调整方法的技术方案。图11示出了适于用来实现本发明实施方式的示例性设备的框图。图11显示的设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图11所示,该设备包括处理器1110、存储器1120、输入装置1150、麦克风1130和扬声器1140;设备中处理器1110的数量可以是一个或多个,图11中以一个处理器1110为例;设备中的处理器1110、存储器1120、输入装置1150、麦克风1130和扬声器1140可以通过总线或其他方式连接,图11中以通过总线连接为例。存储器1120作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的音量调整方法对应的程序指令/模块(例如,音量调整装置中的环境噪声获取模块1010、增益调整触发模块1020、第一增益因子调整模块1030和增益调整模块1040)。存储器1120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器1120可进一步包括相对于处理器1110远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。输入装置1150可用于接收输入的数字或字符信息,例如待播放音频信号,以及产生与设备的用户设置以及功能控制有关的键信号输入。实施例七本发明实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种音量调整方法,该方法包括:通过麦克风获取环境噪声;若所述环境噪声的音量达到预设音量阈值,则触发音量增益调整;依据待播放音频信号的音频频率特性,调整所述待播放音频信号中至少一个频段的音频信号的音量增益因子;采用各频段的音量增益因子对所述音频信号进行音量增益调整。当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的音量调整方法中的相关操作。通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的音量调整方法。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1