语音增益的调整方法、装置及终端与流程

文档序号:13097463阅读:343来源:国知局
语音增益的调整方法、装置及终端与流程

本发明涉及通信领域,具体而言,涉及一种语音增益的调整方法、装置及终端。



背景技术:

终端采用麦克风采集语音,麦克风采集语音增益为固定值,终端发送响度也为固定值,符合国内外标准要求。那么,在免提通话时若用户与终端之间距离变化将导致发送给接收方的语音大小发生变化,影响用户体验。另外,由于为实现一定距离的语音识别,一些智能终端将录音状态下的麦克风通路增益设置极大,也将引起用户较近距离录音因电信号幅度过大出现削波,用扬声器播放录音时出现破音现象。

相关技术中,主要通过以下两种方式调整麦克风增益:一种是通过传感器检测终端与用户之间的距离,调整麦克风增益;另一种则是统计语音输入经放大及a/d转换后的总体幅度值,并与预设目标值对比,进而调整麦克风增益。

然而,上述调整方式存在如下问题:对于上述第一种调整方式,由于用户说话音量不能保证始终如一,因此,固定距离下设置固定麦克风增益也无法保证用户语音响度的稳定;对于上述第二种调整方式:该方式的实现方式复杂,计算一段语音的整体幅度难免延时,不能及时响应调整增益。



技术实现要素:

本发明实施例提供了一种语音增益的调整方法、装置及终端,以至少解决相关技术中存在的上述技术问题之一。

根据本发明的一个实施例,提供了一种语音增益的调整方法,包括:获取指定语音信号的预定频点的灵敏度;根据获取的所述灵敏度,以及基准语音信号的所述预定频点的基准灵敏度,调整终端的语音增益。

可选地,在所述预定频点包括参考频点和多个统计频点的情况下,获取指定语音信号的预定频点的灵敏度包括:获取指定语音信号的所述参考频点的第一参考灵敏度和所述多个统计频点的第一统计灵敏度;根据获取的所述灵敏度,以及基准语音信号的所述预定频点的基准灵敏度,调整终端的语音增益包括:根据获取的所述第一参考灵敏度、所述第一统计灵敏度,以及所述基准语音信号的所述参考频点的第二参考灵敏度、所述多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,通过以下方式,获取所述第一统计灵敏度:对所述指定语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据所述第一统计均值确定所述第一统计灵敏度;和/或,通过以下方式,获取所述第二统计灵敏度:对所述基准语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据所述第二统计均值确定所述第二统计灵敏度。

可选地,通过以下方式,得到所述第一统计均值:统计所述指定语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第一统计均值;和/或,通过以下方式,得到所述第二统计均值:统计所述基准语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第二统计均值。

可选地,根据获取的所述第一参考灵敏度、所述第一统计灵敏度,以及所述基准语音信号的所述参考频点的第二参考灵敏度和所述多个统计频点的第二统计灵敏度,调整终端的语音增益包括:分别确定所述第一参考灵敏度与所述第一统计灵敏度的第一差值以及所述第二参考灵敏度与所述第二统计灵敏度的第二差值;根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益。

可选地,根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益包括:在所述第一参考灵敏度大于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整所述终端的语音增益;和/或,在所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值小于所述第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整所述终端的语音增益;其中,所述第三差值为所述第一差值与所述第二差值之差,所述第四差值为所述第一参考灵敏度与所述第二参考灵敏度之差。

可选地,根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益包括:在所述第一参考灵敏度大于所述第二参考灵敏度,且所述第一差值小于所述第二差值,或者所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,重新获取所述第二参考灵敏度以及所述第二差值。

根据本发明的另一个实施例,提供了一种语音增益的调整装置,包括:获取模块,用于获取指定语音信号的预定频点的灵敏度;调整模块,用于根据获取的所述灵敏度,以及基准语音信号的所述预定频点的基准灵敏度,调整终端的语音增益。

可选地,所述获取模块,还用于在所述预定频点包括参考频点和多个统计频点的情况下,获取指定语音信号的所述参考频点的第一参考灵敏度和所述多个统计频点的第一统计灵敏度;所述调整模块,还用于在所述预定频点包括参考频点和多个统计频点的情况下,根据获取的所述第一参考灵敏度、所述第一统计灵敏度,以及所述基准语音信号的所述参考频点的第二参考灵敏度、所述多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,所述获取模块还用于通过以下方式,获取所述第一统计灵敏度:对所述指定语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据所述第一统计均值确定所述第一统计灵敏度;和/或,通过以下方式,获取所述第二统计灵敏度:对所述基准语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述基准语音信号的所述多个统计频点对应的多个频点电压的第二统计均值;根据所述第二统计均值确定所述第二统计灵敏度。

可选地,所述获取模块还用于通过以下方式,得到所述第一统计均值:统计所述指定语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第一统计均值;和/或,通过以下方式,得到所述第二统计均值:统计所述基准语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第二统计均值。。

可选地,所述调整模块包括:确定单元,用于分别确定所述第一参考灵敏度与所述第一统计灵敏度的第一差值以及所述第二参考灵敏度与所述第二统计灵敏度的第二差值;调整单元,用于根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益。

可选地,所述调整单元包括:第一调整子单元,用于在所述第一参考灵敏度大于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整所述终端的语音增益;和或,第二调整子单元,用于在所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值小于所述第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整所述终端的语音增益;其中,所述第三差值为所述第一差值与所述第二差值之差,所述第四差值为所述第一参考灵敏度与所述第二参考灵敏度之差。

可选地,所述调整单元包括:获取子单元,用于在所述第一参考灵敏度大于第二参考灵敏度,且所述第一差值小于所述第二差值,或者所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,重新获取所述第二参考灵敏度以及所述第二差值。

根据本发明的又一个实施例,还提供了一种终端,该终端包括上述任一项所述的装置。

根据本发明的又一个实施例,还提供了一种存储介质。该存储介质设置为存储用于执行以下步骤的程序代码:获取指定语音信号的预定频点的灵敏度;根据获取的所述灵敏度,以及基准语音信号的所述预定频点的基准灵敏度,调整终端的语音增益。

可选地,存储介质还设置为存储用于执行以下步骤的程序代码:在所述预定频点包括参考频点和多个统计频点的情况下,获取指定语音信号的预定频点的灵敏度包括:获取指定语音信号的所述参考频点的第一参考灵敏度和所述多个统计频点的第一统计灵敏度;根据获取的所述灵敏度,以及基准语音信号的所述预定频点的基准灵敏度,调整终端的语音增益包括:根据获取的所述第一参考灵敏度、所述第一统计灵敏度,以及所述基准语音信号的所述参考频点的第二参考灵敏度、所述多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,存储介质还设置为存储用于执行以下步骤的程序代码:通过以下方式,获取所述第一统计灵敏度:对所述指定语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据所述第一统计均值确定所述第一统计灵敏度;和/或,通过以下方式,获取所述第二统计灵敏度:对所述基准语音信号的所述多个统计频点对应的多个频点电压进行统计,得到所述基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据所述第二统计均值确定所述第二统计灵敏度。

可选地,通过以下方式,得到所述第一统计均值:统计所述指定语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第一统计均值;和/或,通过以下方式,得到所述第二统计均值:统计所述基准语音信号的所述多个统计频点对应的多个频点电压的平均值或者均方根值,得到所述第二统计均值。

可选地,根据获取的所述第一参考灵敏度、所述第一统计灵敏度,以及所述基准语音信号的所述参考频点的第二参考灵敏度和所述多个统计频点的第二统计灵敏度,调整终端的语音增益包括:分别确定所述第一参考灵敏度与所述第一统计灵敏度的第一差值以及所述第二参考灵敏度与所述第二统计灵敏度的第二差值;根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益。

可选地,根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益包括:在所述第一参考灵敏度大于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整所述终端的语音增益;和/或,在所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值小于所述第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整所述终端的语音增益;其中,所述第三差值为所述第一差值与所述第二差值之差,所述第四差值为所述第一参考灵敏度与所述第二参考灵敏度之差。

可选地,存储介质还设置为存储用于执行以下步骤的程序代码:根据所述第一参考灵敏度相对于所述第二参考灵敏度的变化,以及所述第一差值相对于所述第二差值的变化,调整终端的语音增益包括:在所述第一参考灵敏度大于所述第二参考灵敏度,且所述第一差值小于所述第二差值,或者所述第一参考灵敏度小于所述第二参考灵敏度,且所述第一差值大于所述第二差值的情况下,重新获取所述第二参考灵敏度以及所述第二差值。

通过本发明,根据指定语音信号的预定频点的灵敏度以及基准语音信号预定频点的灵敏度,调整终端的语音增益,实现了用户语音输入增益的自动调整,可以解决相关技术中根据终端与用户之间的距离调整终端增益存在的无法保证用户语音响度的稳定的问题,达到保证用户语音响度稳定,提高用户体验的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明实施例的语音增益的调整方法的移动终端的硬件结构框图;

图2是根据本发明实施例的语音增益的调整方法的流程图;

图3是根据本发明优选实施例的语音增益的调整方法的智能终端的硬件结构框图;

图4是根据本发明优选实施例的语音增益的调整方法的流程图;

图5是根据本发明优选实施例的麦克风采集语音频响随声源与麦克风距离的变化曲线图;

图6是根据本发明实施例的语音增益的调整装置的结构框图;

图7是根据本发明实施例的语音增益的调整装置中调整模块64的结构框图;

图8是根据本发明实施例的语音增益的调整装置中调整单元74的结构框图一;

图9是根据本发明实施例的语音增益的调整装置中调整单元74的结构框图二。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的语音增益的调整方法的移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的语音增益的调整方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述移动终端的语音增益的调整方法,图2是根据本发明实施例的语音增益的调整方法的流程图,如图2所示,该流程包括如下步骤:

步骤s202,获取指定语音信号的预定频点的灵敏度;

步骤s204,根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益。

通过上述步骤,根据获取的指定语音信号的预定频点的灵敏度以及基准语音信号的预定频点的灵敏度,调整终端的语音增益,解决了相关技术中根据终端与用户之间的距离调整终端增益存在的无法保证用户语音响度的稳定的问题,通过引入语音信号的频点灵敏度来调整终端的增益,相对于相关技术中仅依据终端与用户之间的距离来调整增益,不仅实现了对增益调整的准确性,而且保证了用户语音响度稳定,提高了用户体验。

可选地,上述步骤的执行主体可以为智能终端、平板电脑等可以采集语音的装置,但不限于此。

可选地,预定频点可以采用多种组合方式,例如,预定频点可以包括语音信号的某一低频、中频或者高频频率。又例如,预定频点可以包括一个参考频点和多个统计频点。对于预定频点包括一个参考频点和多个统计频点的情况,上述步骤s202还可以包括:获取指定语音信号的参考频点的第一参考灵敏度和多个统计频点的第一统计灵敏度;上述步骤s204还可以包括:根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度、多个统计频点的第二统计灵敏度,调整终端的语音增益。

通过本发明实施例的上述技术方案,根据指定语音信号的参考频点的第一参考灵敏度和多个统计频点的第一统计灵敏度以及基准语音信号参考频点的第二参考灵敏度和多个统计频点的第二统计灵敏度,调整终端的语音增益,由于采用了多个频点同时用于终端语音增益的调整,提高了终端语音增益调整的准确性和可靠性。

可选地,可以采用多种方式获取第一统计灵敏度,例如,首先对指定语音信号的多个统计频点对应的多个频点电压进行统计,得到指定语音信号的多个统计频点对应的多个频点电压的第一统计均值,然后根据第一统计均值确定第一统计灵敏度。可以采用多种方式获取第二统计灵敏度,例如,对基准语音信号的多个统计频点对应的多个频点电压进行统计,得到基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据第二统计均值确定第二统计灵敏度。

通过本发明实施例的上述技术方案,根据对语音信号多个统计频点对应的频点电压的进行统计得到的统计均值,确定语音信号的统计灵敏度,提高了确定的统计灵敏度的准确性和可靠性。

可选地,可以采用多种方式得到第一统计均值,例如,统计指定语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第一统计均值。可以采用多种方式得到第二统计均值,例如,统计基准语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第二统计均值。当然,除了平均值或者均方根值,其他可以得到多个参数统计均值的公式,例如,加权平均等,均可以作为得到第一统计均值和/或第二统计均值的方式。

通过本发明实施例的上述技术方案,统计语音信号的多个统计频点对应的多个频点电压的平均值或者均方根,得到统计均值,在保证统计均值的可靠性的前提下,提高了得到统计均值的效率。

可选地,上述步骤s204还可以包括:分别确定第一参考灵敏度与第一统计灵敏度的第一差值以及第二参考灵敏度与第二统计灵敏度的第二差值;根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益。

可选地,根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益可以采用多种方式:例如,在第一参考灵敏度大于第二参考灵敏度,且第一差值大于第二差值的情况下,第三差值(第一差值与第二差值之差)与第四差值为(第一参考灵敏度与第二参考灵敏度之差)之差作为增益调整值,调整终端的语音增益。又例如,在第一参考灵敏度小于第二参考灵敏度,且第一差值小于第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整终端的语音增益。在上述两种情况下,考虑到用户语音频谱具有较好的一致性,同时考虑到频点的灵敏度随着用户与终端麦克风的距离的增加而减少,分别确定不同的调整值对终端的语音增益进行调整。再例如,如果用户语音信号的参考灵敏度的变化(这里的变化可能是由于终端与用户之间的距离发生变化,或者用户语音信号的响度发生变化),与参考灵敏度和统计灵敏度差值的变化不具备一致性,则可以停止对终端语音增益的调整,重新获取基准语音信号,并根据基准语音信号得到第二参考灵敏度和第二差值。

通过本发明实施例的上述技术方案,利用用户语音频谱的一致性,根据参考灵敏度的变化以及参考灵敏度与统计灵敏度之差的变化,作为终端语音增益的调整值,实现了用户语音输入增益的自动调整,避免了免提通话发送语音响度受距离变化影响,也可以避免远、近距离录音的声音过小或过大破音问题,以及用户自身声音响度的变化对语音信号的影响。

此外,除了根据语音信号参考频点和多个统计频点的频点电压的灵敏度的变化调整终端的语音增益外,还可以通过根据语音信号参考频点和多个统计频点的频点电压的变化,调整终端的语音增益。利用语音信号的不同频点的频点电压随语音信号响度的变化规律,根据一个或多个频点的频点电压的变化统计,调整终端的语音增益。

基于上述实施例及优选实施方式,为说明方案的整个流程交互,在本优选实施例中,提供了一种语音增益的调整方法,图3是根据本发明优选实施例的语音增益的调整方法的智能终端的硬件结构框图,如图3所示,智能终端30可以包括一个或多个(图中仅示出一个)前述存储器104、声音采集装置302、增益调整模块304、检测模块306、处理模块308以及基带处理器3010。本领域普通技术人员可以理解,图3所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,移动终端10还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。下面对该移动终端进行说明。

声音采集装置302,用于将语音输入声信号转换为电压信号;

增益调整模块304,连接至上述声音采集装置302,用于调整语音输入电信号放大增益;

检测模块306,连接至上述声音采集装置302,用于获取语音输入各频点电压;

处理模块308,连接至上述检测模块306和上述增益调整模块304,用于获取语音输入各频点灵敏度,并计算语音输入待调整增益值;

存储器104,连接至上述处理模块308,用于存放语音基准频响数据;

基带处理器3010,连接至上述增益调整模块304,用于语音输入的数字信号处理。

上述各模块工作顺序大致为:用户语音输入—>声音采集装置302—>语音电信号—>检测模块306(获取语音频响数据)—>处理模块308(计算语音输入调整增益)—>增益调整模块304—>基带处理器3010(基带芯片)处理。

其中,基带处理器3010属于现有终端语音处理技术,与本申请的主要内容关联性不大,因此,不做详细说明。

在本优选实施例中提供了一种运行于上述智能终端的语音增益的调整方法,图4是根据本发明优选实施例的语音增益的调整方法的流程图,如图4所示,该流程包括如下步骤:

步骤s402,声音采集装置获取用户初次语音输入。

其中,声音采集装置302用于获取用户语音输入,将声压转换为电压信号。

用户选择合适距离语音输入(如,用户手持通话时人机距离较稳定,可以选择手持语音通话状态的距离),此时,人嘴与终端麦克风距离为基准距离。语音声信号经声音采集装置302转换为电压信号。这里的初次语音输入(与前述基准语音信号的作用类似)是相对于语音增益的调整而言的,是为了获取调节的基准灵敏度和基准差值,而不是指用户第一次进行语音输入。

步骤s404,检测模块获取各频点电压。

其中,检测模块306用于获取语音输入多个频点的电压。

检测模块306可以包括多个不同频率的带阻滤波器和峰值检波电路,通过不同频率带阻滤波器和峰值检测电路可以获取多个语音输入频点电压,获取的频点电压可以包括一个参考频点的频点电压,及一个或多个其余频点的频点电压(与前述多个统计频点的作用类似)。

以窄带语音(300hz-3400hz)为例,根据音频响度加权计算标准,其响度加权计算范围在200-4000hz,语音响度集中在400hz-1600hz,即,400hz-1600hz范围内响度占比较大,而其他频点语音响度统计占比极小(也就是其余频率语音响度占比较小)。

考虑到中、高频点灵敏度容易受终端位置偏移影响,低频语音灵敏度不易受终端手持位置不同或手持角度变化影响,以语音输入频率范围内的某一低频频率(可以为300hz以下)作为参考频点,选择400hz-1600hz范围内一个或多个频点作为响度统计频点。以100hz为参考频点、以500hz、1000hz、1500hz三个低、中、高频点为统计频点为例,检测模块306获取参考频点(100hz)的电压v0,以及统计频点(500hz、1000hz、1500hz)电压v1、v2、v3。

步骤s406,处理模块计算参考频点灵敏度和统计频点灵敏度,以及二者差值;将参考频点灵敏度作为基准灵敏度,将二者差值作为基准差值。

其中,处理模块308用于将各频点电压转换为各频点灵敏度,并基于参考频点灵敏度、响度统计频点灵敏度及基准灵敏度三者进行计算获取语音输入调整增益。

检测模块306获取上述用户合适距离下语音输入的参考频点的参考频点电压以及多个统计频点的频点电压,并发送给处理模块308,由处理模块308计算参考频点的参考频点灵敏度作为基准灵敏度,则后续可以根据参考频点灵敏度与基准灵敏度的比较来判断声源距离的增大或减小;处理模块308计算其余频点的响度统计频点灵敏度(或称为统计灵敏度),这里,响度统计频点灵敏度,是指响度统计频率范围内(如窄带语音300hz-3400hz)一个或多个频点按数学公式计算的灵敏度统计值。具体可以如下:

根据灵敏度计算公式,计算参考频点的参考频点灵敏度,将参考频点灵敏度作为基准灵敏度s0(与前述第二参考灵敏度的作用类似)。

以某一数学计算公式对其余频点的频点电压进行统计,例如,平均值计算公式:

其中,vavg为频点电压的平均值,vi为频点i的频点电压,n为频点的个数。

或者,均方根计算公式:

其中,vrms为频点电压的均方根值,vi为频点i的频点电压,n为频点的个数。

根据灵敏度计算公式,计算其余频点的频点电压进行统计后的统计电压的灵敏度,作为统计灵敏度(与前述第二统计灵敏度的作用类似);获取该统计灵敏度与基准灵敏度差值,作为基准差值δs0(与前述第二差值的作用类似)。基准差值δs0与将基准灵敏度s0一起存入存储器104。此时,存储器104用于预设基准灵敏度和基准差值。

其中,灵敏度的计算公式可以有多种,例如,音频电压相对与一伏电压的对数计算式:

dbv=20lg(vx/1v)(3)

其中,dbv为灵敏度,vx为音频电压。

以前述以100hz为参考频点、以500hz、1000hz、1500hz三个低、中、高频点为统计频点为例,处理模块308根据灵敏度计算公式获得参考频点灵敏度,以及对统计频点电压平均后[(v1+v2+v3)/3]换算成统计频点灵敏度。

步骤s408,用户后续语音经声音采集装置转换。

用户后续语音输入过程中,经声音采集装置302进行声电转换。

步骤s410,检测模块获取语音各频点电压。

步骤s412,处理模块计算参考频点灵敏度和统计频点灵敏度,以及二者差值;与基准灵敏度、基准差值计算待调整增益值,发送给增益调整模块304。

在上述步骤s408至步骤s412中,声音采集装置302继续获取用户语音,检测模块306获取语音频点电压(参考频点和一个或多个统计频点与首次用户语音输入的参考频点和多个统计频点相同),处理模块308计算后续获取的用户语音的参考频点si灵敏度(与前述第一参考灵敏度的作用类似)和统计灵敏度(与前述第一统计灵敏度的作用类似),并根据参考频点灵敏度si、统计灵敏度、基准灵敏度s0和基准差值δs0计算需要调整的增益值,并发给增益调整模块304进行增益增加或减小处理。根据参考频点灵敏度si、统计灵敏度、基准灵敏度s0和基准差值δs0计算需要调整的增益值可以采用多种方式,例如,计算后续获取的用户语音的参考频点灵敏度si和统计灵敏度的差值δsi(与前述第一差值的作用类似),并与参考频点灵敏度si和基准灵敏度s0的差值,以及基准差值δs0一起计算语音调整增益值。

具体而言,处理模块308比较参考频点灵敏度si和基准灵敏度s0的差值,若用户(音源)与终端(麦克风)之间的相对距离增加,则参考频点灵敏度si小于基准灵敏度s0,统计灵敏度与参考频点灵敏度差值δsi小于基准差值δs0,此时,语音输入需加大增益,调整值为n=(δs0-δsi)+(s0-si)。

反之,若用户与终端之间的相对距离减小,则参考频点灵敏度si大于基准灵敏度s0,统计灵敏度与参考频点灵敏度差值δsi大于基准差值δs0,此时,语音输入需降低增益,调整值为m=(δsi-δs0)-(si-s0)。

进一步说明本发明优选实施例,图5是根据本发明优选实施例的麦克风采集语音频响随声源与麦克风距离的变化曲线图,如图5所示,声源与麦克风距离增加,则语音各频点灵敏度下降,因波长长短及频率指向性等物理特性,同等条件下低频语音衰减较小,而高频语音衰减较大,具体表现为低频灵敏度下降较少,中、高频灵敏度下降较多。

受终端位置、角度差异影响个别中高频点灵敏度会有异常衰减现象,可以选择较多统计频点数量减少误差;也可以选择较少数量低频点(如只选400-800hz范围内两三个频点),低频点不易受终端角度位置差异影响。对用户语音而言,其语音频谱具有较好的一致性,通过统计频点灵敏度计算方式可以减少因终端手持方式、角度引起用户语音中、高频个别频点灵敏度衰减带来的影响,而选择低频语音获取参考频点灵敏度,由于同等能量下低频语音传播损耗较小,低频波长较长,其灵敏度不受终端手持方式、角度影响,且低频点语音响度小,不在国内外音频标准中响度统计频率范围内,对用户语音响度大小影响可忽略,因此,选择低频参考频点灵敏度为基准,及其与统计频点灵敏度差值大小进行语音增益的调整具有较好的准确性,根据参考频点灵敏度和统计频点灵敏度二者的变化可以通过图5所示灵敏度变化特征来判断声源距离的远近或用户语音的大小变化。

步骤s414,增益调整模块调整放大增益,继续执行步骤s408。

处理模块308将调整增益值发送给增益调整模块304重新设定放大增益,此时,增益调整模块304用于调整用户语音输入增益。而在获得增益调整值后,由增益调整模块304进行语音增益重新设置,此为常用技术,这里不做详细说明。

用户语音可能因病产生变化,或者终端借给他人使用带来语音变化,即语音频谱发生变化,对应的参考频点灵敏度和统计频点灵敏度也会产生较大差异,如参考频点灵敏度si大于基准灵敏度s0,而统计频点灵敏度与参考频点灵敏度差值δsi小于基准差值δs0;或者参考频点灵敏度si小于基准灵敏度s0,而统计频点灵敏度与参考频点灵敏度差值δsi大于基准差值δs0;因此可以根据此点进行判断,如果参考灵敏度si和统计频点灵敏度与参考频点灵敏度差值δsi没有同时大于或同时小于基准灵敏度s0和基准差值δs0,则说明语音频响发生较大变化。因此,作为一个可选的实施方案,本发明优选实施例的语音增益的调整方法还可以包括:提示用户重新进行设定基准灵敏度s0和基准差值δs0。

相关技术中,用户使用智能终端免提通话,嘴与麦克风距离难免会发生变化,这将导致对方听到声音大小不一,影响用户体验;另外,由于为实现较大距离的语音识别,一些智能终端将麦克风录音增益设置极大,引起用户较近距离录音时因电信号幅度过大出现削波,用扬声器播放录音时出现破音现象。通过本发明实施例的上述技术方案,实现用户语音输入增益的自动调整,可以避免免提通话发送语音响度受距离变化影响,也可以避免远、近距离录音的声音过小或过大破音问题。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种语音增益的调整装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图6是根据本发明实施例的语音增益的调整装置的结构框图,如图6所示,该装置包括获取模块62(与前述处理模块308的部分功能类似)和调整模块64(与前述增益调整模块304的功能类似),下面对该装置进行说明。

获取模块62,用于获取指定语音信号的预定频点的灵敏度;调整模块64,连接至上述获取模块62,用于根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益。

可选地,上述获取模块62还可以用于在预定频点包括参考频点和多个统计频点的情况下,获取指定语音信号的参考频点的第一参考灵敏度和多个统计频点的第一统计灵敏度。上述调整模块64还用于在预定频点包括参考频点和多个统计频点的情况下,根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度、多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,上述获取模块62还可以用于通过以下方式获取第一统计灵敏度:对指定语音信号的多个统计频点对应的多个频点电压进行统计,得到指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据第一统计均值确定第一统计灵敏度;和/或,通过以下方式获取第二统计灵敏度:对基准语音信号的多个统计频点对应的多个频点电压进行统计,得到基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据第二统计均值确定第二统计灵敏度。

可选地,上述获取模块62还可以用于通过以下方式获取第一统计均值:统计指定语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第一统计均值;和/或,通过以下方式获取第二统计均值:统计基准语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第二统计均值。

图7是根据本发明实施例的语音增益的调整装置中调整模块64的结构框图,如图7所示,该调整模块64包括确定单元72(与前述处理模块308的部分功能类似)和调整单元74,下面对该调整模块64进行说明。

确定单元72,用于分别确定第一参考灵敏度与第一统计灵敏度的第一差值以及第二参考灵敏度与第二统计灵敏度的第二差值;调整单元74,连接至上述确定单元72,用于根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益。

图8是根据本发明实施例的语音增益的调整装置中调整单元74的结构框图一,如图8所示,该调整单元74包括第一调整子单元82、第二调整子单元84,下面对该调整单元74进行说明。

第一调整子单元82,用于在第一参考灵敏度大于第二参考灵敏度,且第一差值大于第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整终端的语音增益;第二调整子单元84,用于在第一参考灵敏度小于第二参考灵敏度,且第一差值小于第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整终端的语音增益;其中,第三差值为第一差值与第二差值之差,第四差值为第一参考灵敏度与第二参考灵敏度之差。

图9是根据本发明实施例的语音增益的调整装置中调整单元74的结构框图二,如图9所示,该调整单元74包括获取子单元92(与前述处理模块308的部分功能类似),下面对该调整单元74进行说明。

获取子单元92,用于在第一参考灵敏度大于第二参考灵敏度,且第一差值小于第二差值,或者第一参考灵敏度小于第二参考灵敏度,且第一差值大于第二差值的情况下,重新获取第二参考灵敏度以及第二差值。上述重新获取第二参考灵敏度以及第二差值可以通过重新获取基准语音信号实现。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:

s1,获取指定语音信号的预定频点的灵敏度;

s2,根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益。

可选地,该存储介质还被设置为存储用于执行以下步骤的程序代码:

在预定频点包括参考频点和多个统计频点的情况下,

获取指定语音信号的预定频点的灵敏度包括:获取指定语音信号的参考频点的第一参考灵敏度和多个统计频点的第一统计灵敏度;

根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益包括:根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度、多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

通过以下方式,获取第一统计灵敏度:对指定语音信号的多个统计频点对应的多个频点电压进行统计,得到指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据第一统计均值确定第一统计灵敏度;和/或,通过以下方式,获取第二统计灵敏度:对基准语音信号的多个统计频点对应的多个频点电压进行统计,得到基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据第二统计均值确定第二统计灵敏度。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

通过以下方式,得到第一统计均值:统计指定语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第一统计均值;和/或,通过以下方式,得到第二统计均值:统计基准语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第二统计均值。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度和多个统计频点的第二统计灵敏度,调整终端的语音增益包括:

s1,分别确定第一参考灵敏度与第一统计灵敏度的第一差值以及第二参考灵敏度与第二统计灵敏度的第二差值;

s2,根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益包括:

在第一参考灵敏度大于第二参考灵敏度,且第一差值大于第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整终端的语音增益;和/或,在第一参考灵敏度小于第二参考灵敏度,且第一差值小于第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整终端的语音增益;

其中,第三差值为第一差值与第二差值之差,第四差值为第一参考灵敏度与第二参考灵敏度之差。

可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:

根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益包括:

在第一参考灵敏度大于第二参考灵敏度,且第一差值小于第二差值,或者第一参考灵敏度小于第二参考灵敏度,且第一差值大于第二差值的情况下,重新获取第二参考灵敏度以及第二差值。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:获取指定语音信号的预定频点的灵敏度;根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:在预定频点包括参考频点和多个统计频点的情况下,获取指定语音信号的预定频点的灵敏度包括:获取指定语音信号的参考频点的第一参考灵敏度和多个统计频点的第一统计灵敏度;根据获取的灵敏度,以及基准语音信号的预定频点的基准灵敏度,调整终端的语音增益包括:根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度、多个统计频点的第二统计灵敏度,调整终端的语音增益。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:通过以下方式,获取第一统计灵敏度:对指定语音信号的多个统计频点对应的多个频点电压进行统计,得到指定语音信号的多个统计频点对应的多个频点电压的第一统计均值;根据第一统计均值确定第一统计灵敏度;和/或,通过以下方式,获取第二统计灵敏度:对基准语音信号的多个统计频点对应的多个频点电压进行统计,得到基准语音信号的多个统计频点对应的多个频点电压的第二统计均值;根据第二统计均值确定第二统计灵敏度。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:通过以下方式,得到第一统计均值:统计指定语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第一统计均值;和/或,通过以下方式,得到第二统计均值:统计基准语音信号的多个统计频点对应的多个频点电压的平均值或者均方根值,得到第二统计均值。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据获取的第一参考灵敏度、第一统计灵敏度,以及基准语音信号的参考频点的第二参考灵敏度和多个统计频点的第二统计灵敏度,调整终端的语音增益包括:分别确定第一参考灵敏度与第一统计灵敏度的第一差值以及第二参考灵敏度与第二统计灵敏度的第二差值;根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益包括:在第一参考灵敏度大于第二参考灵敏度,且第一差值大于第二差值的情况下,将第三差值与第四差值之差作为增益调整值,调整终端的语音增益;和/或,在第一参考灵敏度小于第二参考灵敏度,且第一差值小于第二差值的情况下,将第三差值与第四差值之和的绝对值作为增益调整值,调整终端的语音增益;其中,第三差值为第一差值与第二差值之差,第四差值为第一参考灵敏度与第二参考灵敏度之差。

可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行:根据第一参考灵敏度相对于第二参考灵敏度的变化,以及第一差值相对于第二差值的变化,调整终端的语音增益包括:在第一参考灵敏度大于第二参考灵敏度,且第一差值小于第二差值,或者第一参考灵敏度小于第二参考灵敏度,且第一差值大于第二差值的情况下,重新获取第二参考灵敏度以及第二差值。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在利用语音频响根据音源距离变化从而实现语音增益调整的。所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1