信息处理方法、装置、电子设备及存储介质与流程

文档序号:26101394发布日期:2021-07-30 18:12阅读:50来源:国知局
信息处理方法、装置、电子设备及存储介质与流程

本公开涉及电子技术领域,尤其涉及信息处理方法、装置、电子设备及存储介质。



背景技术:

相关技术中,电子设备在播放音视频过程中会根据外界环境的噪声情况自动进行音视频的参数的调节,但是这种调节方式往往是在外界环境的噪声音量大于预设音量时便进行播放音量的增大调节,显然,这种方式过于笼统,存在较多的误判场景,例如,当外界环境的噪声为手机通话声或者手机铃声等时,往往不需要调大电子设备的播放音量。基于此,如何准确地基于外界环境的噪声自动调节电子设备的音视频的参数成为了亟需解决的技术问题。



技术实现要素:

为克服相关技术中存在的问题,本公开提供一种音频信号的调整方法、装置、电子设备及存储介质,所述技术方案如下:

根据本公开实施例的第一方面,提供一种信息处理方法,用于电子设备,包括:

在所述电子设备播放音视频过程中,采集环境音频信息;

对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景;

在所述环境音频信息表征所述目标噪声场景的情况下,对所述电子设备播放的所述音视频的参数进行处理。

在一些实施例中,所述对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景,包括:

根据所述环境音频信息确定第一环境噪声信息;

在所述第一环境噪声信息包括残余回声信息的情况下,确定所述残余回声信息对应的第一频段范围;

根据所述残余回声信息的所述第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息;

根据所述第二环境噪声信息,确定所述环境音频信息是否表征所述目标噪声场景。

在一些实施例中,所述根据所述第二环境噪声信息,确定所述环境音频信息是否表征所述目标噪声场景,包括:

根据所述第二环境噪声信息,确定第二环境噪声信息的第一噪声能量;

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些实施例中,所述预设时段包括:时长相同且相邻的第一预设子时段和第二预设子时段;

所述在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景,包括:

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述第一预设子时段的所述第二环境噪声信息与所述第二预设子时段的所述第二环境噪声信息的相关度;

在所述相关度大于或等于相关度阈值的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些实施例中,所述方法还包括:

在所述第二环境噪声信息包括特定场景的声音信息的情况下,确定特定场景的所述声音信息的第二频段范围;

根据特定场景的所述声音信息的所述第二频段范围,对所述第二环境噪声信息进行处理得到第三环境噪声信息;

所述确定所述第一预设子时段的所述第二环境噪声信息与所述第二预设子时段的所述第二环境噪声信息的相关度,包括:

确定所述第一预设子时段的所述第三环境噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关。

在一些实施例中,所述第一预设子时段和所述第二预设子时段均包括:预设数量的帧时段;

所述确定所述第一预设子时段的所述第三环境噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关度,包括:

确定所述第一预设子时段的所述第三环境噪声信息中各个帧时段的第一噪声子能量;根据各个帧时段的第一噪声子能量,确定所述第一预设子时段的所述第三环境噪声信息的第一噪声子能量的能量分布;

确定所述第二预设子时段的所述第三环境噪声信息中各个帧时段的第二噪声子能量;根据各个帧时段的第二噪声子能量,确定所述第二预设子时段的所述第三环境噪声信息的所述第二噪声子能量的能量分布;

根据所述第一噪声子能量的能量分布与所述第二噪声子能量的能量分布,确定所述第一预设子时段的所述第三噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关度。

在一些实施例中,所述方法还包括:

确定所述第二预设子时段的所述第一环境噪声的第二噪声能量中各个帧时段的第三噪声子能量;

所述在所述相关度大于或等于相关度阈值的情况下,确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比是否符合预设条件;

在各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件的情况下,确定环境音频信息表征所述目标噪声场景,其中,所述预设条件为所述能量占比表征的频谱波动情况超过预设波动情况。

在一些实施例中,所述电子设备包括多个扬声器;

所述根据所述环境音频信息确定第一环境噪声信息,包括:

根据所述多个扬声器采集的所述环境音频信息,对所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息。

根据本公开实施例的第二方面,提供一种信息处理装置,应用于电子设备,包括:

采集模块,用于在所述电子设备播放音视频过程中,采集环境音频信息;

第一确定模块,用于对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景;

第一处理模块,用于在所述环境音频信息表征所述目标噪声场景的情况下,对所述电子设备播放的所述音视频的参数进行处理。

在一些实施例中,所述第一确定模块,还包括:

第一确定子模块,用于根据所述环境音频信息确定第一环境噪声信息;

第二确定子模块,用于在所述第一环境噪声信息包括残余回声信息的情况下,确定所述残余回声信息对应的第一频段范围;

处理子模块,用于根据所述残余回声信息的第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息;

第三确定子模块,用于根据所述第二环境噪声信息,确定所述环境音频信息是否表征所述目标噪声场景。

在一些实施例中,所述第三确定子模块,还用于:

根据所述第二环境噪声信息,确定所述第二环境噪声信息的第一噪声能量;

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些实施例中,所述预设时段包括:时长相同且相邻的第一预设子时段和第二预设子时段;

所述第三确定子模块,还用于:

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述第一预设子时段的所述第二环境噪声信息与所述第二预设子时段的所述第二环境噪声信息的相关度;

在所述相关度大于或等于相关度阈值的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些实施例中,所述装置还包括:

第二确定模块,用于在所述第二环境噪声信息包括特定场景的声音信息的情况下,确定特定场景的所述声音信息的第二频段范围;

第二处理模块,用于根据特定场景的所述声音信息的所述第二频段范围,对所述第二环境噪声信息进行处理得到第三环境噪声信息;

所述第三确定子模块,还用于:

确定所述第一预设子时段的所述第三环境噪声信息与第二预设子时段的所述第三环境噪声信息的相关度。

在一些实施例中,所述第一预设子时段和所述第二预设子时段均包括:预设数量的帧时段;

所述第三确定子模块,具体用于:

确定所述第一预设子时段的所述第三环境噪声信息中各个帧时段的第一噪声子能量;根据各个帧时段的第一噪声子能量,确定所述第一预设子时段的所述第三环境噪声信息的第一噪声子能量的能量分布;

确定所述第二预设子时段的所述第三环境噪声信息中各个帧时段的第二噪声子能量;根据各个帧时段的第二噪声子能量,确定所述第二预设子时段的所述第三环境噪声信息的第二噪声子能量的能量分布;

根据所述第一噪声子能量的能量分布与第二噪声子能量的能量分布,确定所述第一预设子时段的所述第三噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关度。

在一些实施例中,所述装置还包括:

第三确定模块,用于确定所述第二预设子时段的所述第一环境噪声信息的第二噪声能量中各个帧时段的第三噪声子能量;

所述第三确定子模块,还具体用于:

在所述相关度大于或等于所述相关度阈值的情况下,确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比是否符合预设条件;

在各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件的情况下,确定环境音频信息表征所述目标噪声场景,其中,所述预设条件为所述能量占比表征的频谱波动情况超过预设波动情况。

在一些实施例中,所述电子设备包括多个扬声器;

所述第一确定子模块,还用于:

根据所述多个扬声器采集的所述环境音频信息,对所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息。

根据本公开实施例的第三方面,提供了一种电子设备,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:执行时实现上述任意所述的信息处理方法。

本公开实施例第四方面,提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行实现上述任意所述的信息处理方法的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:

本公开实施例中能够在电子设备播放音视频过程中,采集环境音频信息,并对采集到的音频信息进行噪声检测,确定出环境音频信息是否表征目标噪声场景,且在所环境噪声信息表征目标噪声场景的情况下,才对电子设备播放的音视频的参数进行处理,使得电子设备对于外界环境噪声的判断不再只是音量大小的判断,而是在确定采集到的环境音频信息表征目标噪声场景的情况下才会对电子设备播放的音视频的参数进行处理,提高电子设备针对外界环境的噪声进行自动音量的调节的调节准确性,减少不在目标噪声场景下的音视频的参数的误调整现象,使得基于环境噪声自动调节电子设备音量的方案的准确性更高。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种信息处理方法的流程图;

图2是根据一示例性实施例示出的一种信息处理方法的另一流程图;

图3是根据一示例性实施例示出的一种信息处理方法的又一流程图;

图4是根据一示例性实施例示出的第三环境噪声的噪声子能量的能量分布曲线;

图5是根据一示例性实施例示出的第三环境噪声的噪声子能量的另一能量分布曲线;

图6是相关技术中基于环境噪声自动调节音量的场景示意图;

图7是根据一具体实施例示出的基于环境噪声自动调节音量的场景示意图;

图8是根据一示例性实施例示出的一种信息处理装置的框图;

图9是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

本公开对基于环境噪声自动调节音视频的参数的方案进行优化,旨在实现准确性更高地自动调节音视频的参数的方案,基于此,为了实现准确性更高地自动调节音视频的参数的方案,本公开提供了一种信息处理方法。

该方法应用于电子设备,所述电子设备具体可以为移动终端、台式电脑、智能家居设备等;其中,移动终端可以为手机、平板电脑、笔记本电脑;智能家居设备可以为智能电视或智能音箱等。可以理解的是,该方法可应用于任何具有音频模组的电子设备上,例如具有麦克风和扬声器的电子设备上。

图1是根据一示例性实施例示出的一种信息处理方法的流程图,如图1所示,所述方法可以包括以下步骤:

步骤11:在所述电子设备播放音视频过程中,采集环境音频信息;

步骤12:对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景;

步骤13:在所述环境音频信息表征所述目标噪声场景的情况下,对所述电子设备播放的所述音视频的参数进行处理。

这里的环境音频信息,是指环境中存在的所有音频信息。示例性的,环境音频信息可以包括但不限于:电子设备自身发出的音频信息、电子设备以外的其他声源发出的音频信息以及目标物体反射的音频信息等,其中,目标物体例如墙体等。

这里的目标噪声场景,是指预先设定的需要进行音视频的参数调节的相关场景。示例性的,家居设备如电吹风等的家居噪声场景可以是本实施例所述的目标噪声场景。当然,在另一些实施例中,用户也可以设定其他的噪声场景为目标噪声场景,例如户外马路上的车流噪声等。

这里,电子设备播放的音视频的参数,可以是电子设备播放的音视频的音量。在一些实施例中,所述对电子设备播放的所述音视频的参数进行处理,可以包括:

对电子设备播放的所述音视频的音量进行调大处理。

在一些实施例中,所述对电子设备播放的所述音视频的音量进行调大处理,还可以包括:

对电子设备播放的所述音视频的音量按照预设第一调节量进行调大处理,例如调大五个音量度。如此,在环境音频信息表征目标噪声场景的情况下,按照固定的预设第一调节量对音量进行调大,可以使得电子设备在目标噪声场景下播放的音视频能够更加清楚地被用户识别的同时,不需要电子设备进行音量调节量的计算,减少了电子设备的计算资源。

为了确保电子设备在目标噪声场景下播放的音视频能够被用户识别到,在另一些实施例中,所述对电子设备播放的所述音视频的音量进行调大处理,还可以包括:

根据环境音频信息中的音量,确定第二调节量;

根据所述第二调节量,对电子设备播放的音视频的音量进行调大处理。

可以理解的是,环境音频信息的音量与第二调节量成正比。如此,可以保证在环境音量信息的音量增大时,同样增大调节量,以确保电子设备在目标噪声场景下播放的音视频能够被用户识别到。

当然,电子设备播放的音视频的参数,还可以是电子设备播放的音视频的播放速度。在一些实施例中,所述对电子设备播放的所述音视频的参数进行处理,可以包括:

对电子设备播放的所述音视频的播放速度进行减慢处理。

如此,在环境音频信息表征目标噪声场景的情况下,通过减慢电子设备播放的音视频的播放速度,可以使得电子设备在目标噪声场景下减慢播放,减少因为目标噪声场景下的噪声对用户正在观看或收听的音视频的干扰的音视频播放量。

本公开实施例,在环境音频信息表征目标噪声场景的情况下,才对电子设备播放的音视频的参数进行处理。相比相关技术中,仅通过外界环境的噪声音量来进行自动音量的调节而言,本公开实施例能够在电子设备播放音视频过程中,采集环境音频信息,并对采集到的音频信息进行噪声检测,确定出环境音频信息是否表征目标噪声场景,且在所环境噪声信息表征目标噪声场景的情况下,才对电子设备播放的音视频的参数进行处理,使得电子设备对于外界环境噪声的判断不再只是音量大小的判断,而是在确定采集到的环境音频信息表征目标噪声场景的情况下才会对电子设备播放的音视频的参数进行处理,提高电子设备针对外界环境的噪声进行自动音量的调节的调节准确性,减少不在目标噪声场景下的音视频的参数的误调整现象。

在另一些实施例中,为了能够提高确定环境音频信息是否表征目标噪声场景的准确性,图2是根据一示例性实施例示出的一种信息处理方法的另一流程图,如图2所示,所述步骤12,即所述对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景,可以包括:

步骤121:根据所述环境音频信息确定第一环境噪声信息;

步骤122:在所述第一环境噪声信息包括残余回声信息的情况下,确定所述残余回声信息对应的第一频段范围;

步骤123:根据所述残余回声信息的所述第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息;

步骤124:根据所述第二环境噪声信息,确定所述环境音频信息是否表征所述目标噪声场景。

可以理解的是,对于电子设备存在多个扬声器的情况下,由于多个扬声器发出的声音之间相互影响,使得电子设备无法准确地得到环境中所产生的回声信息,从而使得还有一部分回声信息被残余下来,产生了残余回声信息。这里的残余回声信息就是指对环境音频信息进行回声消除处理后,未消除掉的那一部分回声信息。

在一些实施例中,所述电子设备包括多个扬声器;所述步骤121,即所述根据所述环境音频信息确定第一环境噪声信息,可以包括:

根据所述多个扬声器采集的所述环境音频信息,对所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息。

这里,所述环境音频信息可以通过麦克风采集得到。

示例性的,所述根据多个扬声器采集的所述环境音频信息,对所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息,可以包括:

直接对多个扬声器采集的所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息。

示例性的,所述直接对多个扬声器采集的所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息,包括:

对多个扬声器采集的所述环境音频信息与扬声器信息进行回声消除时复用同一傅里叶变换函数,计算得到所述第一环境噪声信息。

这里,扬声器信息是指扬声器的参数,例如,扬声器的出厂参数等。

相比现有技术中,先对多个扬声器采集的环境音频信息进行傅里叶变换,再将进行反傅里叶变换后得到的数据与回声消除时使用的扬声器信息再进行一次傅里叶变换来计算第一环境噪声信息而言,本实施例中,对多个扬声器采集的所述环境音频信息与扬声器信息进行回声消除时复用同一傅里叶变换函数,计算得到所述第一环境噪声信息,可以减少对多个扬声器采集的环境音频信息进行多次傅里叶变换与反变换的计算量,同时减少对多个扬声器采集的环境音频进行多次傅里叶变换与反变换计算过程中的数据遗漏所带来回声消除不准确现象等。

这里,对多个扬声器采集的所述环境音频信息与扬声器信息进行回声消除前,所述方法还包括:对所述环境音频信息以及所述扬声器信息进行预处理。

其中,对所述环境音频信息以及所述扬声器信息进行预处理,可以包括:对环境音频信息与扬声器信息进行分帧加窗处理。

示例性的,环境音频信息s(n),扬声器信息y(n),以采样率为16000为例,对s(n)和y(n)进行分帧加窗,窗函数为w(n),帧长为16ms移为8ms,窗函数可为常见的汉宁窗或者汉明窗中其中的任意一种。分帧加窗后为s(n,m)和y(n,m),m其中表示帧数的索引。分帧加窗具体可参见表达式(1)和(2):

s(n,m)=s((m-1)*inc+n)*w(n),1≤n≤l(1)

y(n,m)=y((m-1)*inc+n)*w(n),1≤n≤l(2)

其中,m表示帧数的索引,l表示帧长,以256为例,inc表示帧移,以128为例,回声消除的输入为s(n,m)和y(n,m),输出即为除去了回声信息的第一环境噪声信息,如环境音频的频谱信息s(k,m),其中k表示傅里叶变换后的频谱信息的索引。

理想情况下,s(k,m)是不包含任何麦克风的回声信息的,但是在实际应用中,现有算法在多声道播放设备下会残留较多的回声信息。

为减少残余回声信息的干扰,本公开实施例的步骤122,在所述第一环境噪声信息包含残余回声信息的情况下,确定所述残余回声信息对应的第一频段范围。

这里,残余回声信息的第一频段范围可以是预先设置在电子设备内的。示例性的,所述步骤122,即所述确定所述残余回声信息对应的第一频段范围,可以包括:读取预先设置在电子设备内的所述残余回声信息的第一频段范围。可以理解的是,所述残余回声信息的第一频段范围可以通过外部仪器检测出来,或者通过实验检测出来。这里,通过实验检测的方式例如可以在提供的相同的噪声环境下,比对播放场景下与未播放场景下所检测出的噪声信息,确定出回声信息的频段范围,将该回声信息的频段范围作为残余回声信息的第一频段范围。在另一些实施例中,所述残余回声信息的第一频段范围,还可以从云端服务器中读取。

示例性的,残余回声信息的第一频段范围可以为小于或等于1200hz频段所在范围。

可以理解的是,由于在第一环境噪声信息包含有残余回声信息的情况下,即第一环境噪声信息不能代表真实的环境噪声信息,相关技术中,由于未将残余回声信息进行剔除,将第一环境噪声信息作为真实的环境噪声信息,这显然会使得判断结果不准确。这里的步骤123,即根据所述残余回声信息的第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息。示例性的,所述根据所述残余回声信息的第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息,可以包括:从所述第一环境噪声信息中选取除去所述第一频段范围以外频段的所述第一环境噪声信息,得到第二环境噪声信息。如此,以第二环境噪声信息作为真实的环境噪声信息,能够提高判断环境噪声信息是否为目标噪声信息的准确性,同时由于计算时除去了第一频段范围,还可以减少计算量。

在另一些实施例中,请参阅图3,如图3所示,所述根据所述第二环境噪声信息,确定所述环境音信息是否表征目标噪声场景,可以包括:

步骤1241:根据所述第二环境噪声信息,确定所述第二环境噪声信息的第一噪声能量;

步骤1242:在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景。

这里,这里,第一噪声能量可以是第二噪声信息在预定时长的能量。示例性的,第一噪声能量可以为第二噪声信息在预定时长的滑动能量。

这里的能量阈值,可以是目标噪声信息对应的噪声场景下的真实环境噪声在预设时段内的最低能量。

需要补充的是,在一些实施例中,所述预设时长,可以包括多个帧时长,其中,多个帧时长可以被整合为多个段数据,其中,一个段数据可以包括多个帧。

在进行第一噪声能量的计算时,先计算第二环境噪声的每一帧的噪声能量。示例性的,以表达式(3)计算每一帧的噪声能量se(m);

m表示帧数的索引,n表示傅里叶变换的长度,一般n=l;r表示计算一帧第二环境噪声时的最低频点。这里,以残余回声信息的频段范围为小于1200hz为例,这里的r可以取20。本实施例中,在计算每一帧的噪声能量时除以n可以防止计算噪声能量时的数值溢出问题。

示例性的,以4帧数据为1段数据,计算1段数据的能量为4帧数据能量的综合,采用表达式(4)计算4帧数据能量的综合:

其中,a为段数据的索引。

示例性的,采用10段数据,以表达式(5)计算10段数据能量的综合:

如此,通过计算多个段数据作为一个第一噪声能量,相比相关技术中,只要噪声能量大于能量阈值便进行音频参数的调节而言,本实施例在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景,使得音频参数基于该目标噪声场景调节的准确性更高,减少短暂的非目标噪声场景下的误调节现象。

为了进一步提高确定目标环境噪声信息的准确性,作为另一可选的实施例,所述预设时段包括:时长相同且相邻的第一预设子时段和第二预设子时段;

所述在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景,包括:

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述第一预设子时段的所述第二环境噪声信息与所述第二预设子时段的所述第二环境噪声信息的相关度;

在所述相关度大于或等于相关度阈值的情况下,确定所述环境音频信息表征所述目标噪声场景。

需要说明的是,预设时段包括时长相同且相邻的第一预设子时段和第二预设子时段,意味着,第一预设子时段和第二预设子时段都在预设时段之内,但第一预设子时段和第二预设子时段之和可以不为预设时段。例如,预设时段为2.5秒,那么第一预设子时段可以为0.5秒到1.5秒的时段,第二预设子时段可以为1.5秒到2.5秒的时段。

在一些实施例中,所述第一预设子时段可以为第三预设子时段之后的时段,这里第三预设子时段可以与第一预设子时段相同,也可以与第一预设子时段不同。本实施例中,通过检测到第二环境噪声信息的第一噪声能量大于能量阈值的第三预设子时段后,再进行第二环境噪声信息的在第一预设子时段和第二预设子时段的相关度的计算,即在噪声信息趋于稳定后再进行相关度计算,可以提高判断的准确性,且可以减少不稳定噪声信息,或者短暂噪声信息带来的不必要的计算。

这里,所述第一预设子时段的第二环境噪声信息与第二预设子时段的环境噪声信息的相关度,可以包括:第一预设子时段的第二环境噪声信息的噪声能量与第二预设子时段的环境噪声信息的噪声能量的差值。

当然,为了能够对相关度进行准确地判断,所述第一预设子时段的第二环境噪声信息与第二预设子时段的环境噪声信息的相关度,还可以包括:第一预设子时段的第二环境噪声信息的噪声能量的能量分布曲线与第二预设子时段的环境噪声信息的噪声能量的能量分布曲线的重合度。总之,第一预设子时段的第二环境噪声信息与第二预设子时段的环境噪声信息越相关,表明该噪声信息越趋于稳定,即该第二环境噪声信息为目标噪声信息的可能性也就越大。

本实施例,通过对所述第一预设子时段的第二环境噪声信息与第二预设子时段的第二环境噪声信息的相关度的判断,在相关度大于或等于相关度阈值,确定第二环境噪声信息为目标噪声信息,可以提高判断是否为目标噪声信息的准确性。

为了简化计算,作为另一可选的实施例,所述方法还包括:

在所述第二环境噪声信息包括特定场景的声音信息的情况下,确定特定场景的所述声音信息的第二频段范围;

根据特定场景的所述声音信息的所述第二频段范围,对所述第二环境噪声信息进行处理得到第三环境噪声信息;

所述确定所述第一预设子时段的第二环境噪声信息与所述第二预设子时段的第二环境噪声信息的相关度,可以包括:

确定所述第一预设子时段的第三环境噪声信息与所述第二预设子时段的第三环境噪声信息的相关度。

这里,特定场景的声音,可以是例如手机铃声,人说话的声音等。由于这些声音并非是目标噪声信息,故可以直接将这些声音所在频段进行剔除,只计算第二频段范围以外的所述第二环境噪声信息,如此,可以减少计算量,提高计算效率。同时,由于人说话的声音等不稳定性较强,在预设时段内的噪声能量的比对时的干扰性较大,故,还能提高判断第二环境噪声在第一预设时段与第二预设时段的相关度比对的准确性。

为了进一步提高相关度比对的准确性,作为另一可选的实施例,所述第一预设子时段和所述第二预设子时段均包括:预设数量的帧时段;

所述确定所述第一预设子时段的第三环境噪声信息与所述第二预设子时段的第三环境噪声信息的相关度,可以包括:

确定第一预设子时段的第三环境噪声信息中各个帧时段的第一噪声子能量;根据各个帧时段的第一噪声子能量,确定所述第一预设子时段的第三环境噪声信息的第一噪声子能量的能量分布;

确定所述第二预设子时段的第三环境噪声信息中各个帧时段的第二噪声子能量;根据各个帧时段的第二噪声子能量,确定所述第二预设子时段的第三环境噪声信息的第二噪声子能量的能量分布;

根据所述第一噪声子能量的能量分布与第二噪声子能量的能量分布,确定所述第一预设子时段的第三噪声信息与所述第二预设子时段的第三环境噪声信息的相关度。

示例性的,请参阅图4,如图4所示,第一预设子时段的第三环境噪声信息中各个帧时段的第一噪声子能量的能量分布曲线41,与第二预设子时段的第三环境噪声信息中各个帧时段的第二噪声子能量的能量分布曲线42,重合度大于重合度阈值,也就是说,所述第一预设子时段的第三噪声信息与所述第二预设子时段的第三环境噪声信息的相关度大于相关度阈值。

在另一些实施例中,请参阅图5,如图5所示,第一预设子时段的第三环境噪声信息中各个帧时段的第一噪声子能量的能量分布曲线51,与第二预设子时段的第三环境噪声信息中各个帧时段的第二噪声子能量的能量分布曲线52,重合度小于重合度阈值,也就是说,所述第一预设子时段的第三环境噪声信息与第二预设子时段的第三环境噪声信息的相关度小于相关度阈值。

需要补充的是,在一些实施例中,会先对预定数量的帧时段的噪声能量进行统计,以便绘制能量分布曲线。这里,预定数量小于预设数量。

示例性的,仍以4帧数据为1段数据,计算1段数据的能量为4帧数据能量的综合,采用表达式(4)计算4帧数据能量的综合:

其中,a为段数据的索引。

为了能够将能量曲线绘制得更加平滑,还可以采用设置数量的段进行能量分布曲线的绘制。示例性的,采用10段数据,以表达式(5)计算10段数据能量的综合:

基于此,可以绘制出更加平滑的能量分布曲线,从而可以确定相关度的重合度进而可以准确地确定出第三环境噪声信息在第一预设时段与第二预设时段的相关度。

在进行相关度计算时,以第一预设时段为0.5s到1.5s,第二预设时段为1.5s为2.5s为例,在所述第一噪声能量大于所述能量阈值开始的0.5s开始存储噪声能量,每段sblock(a)采用4帧子能量的拼接方式,利用表达式(6)计算得到。

这里,r为40,表示只使用大于2400hz的频段的频谱信息,减少残余回声以及特定场景的声音对相关度计算的干扰,减少了计算量。

按照表达式(7),分别确定第0.5秒到第1.5秒和2.5秒的噪声能量均值。

这里,c的取值为31,如此,近似选取了1s的噪声能量的平均值。

这里,相关度的计算时,可以通过皮尔逊相关系数计算sblockmean(0.5)和sblockmean(1.5)的相关度。

在一些实施例中,相关度阈值可以为0.85。当然,在其他实施例中,相关度阈值还可以取其他值。对于相关度阈值的取值,可以根据噪声场景对应的噪声类型等确定。可以理解的是,不同的噪声类型对应的噪声的稳定性不同,其中,噪声的稳定性与噪声阈值正相关。例如,在家居噪声场景中,相关度阈值可以取0.85。

为了进一步提高确定目标噪声信息的准确性,作为另一可选的实施例,所述方法还包括:

在所述相关度大于或等于所述相关度阈值的情况下,确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比是否符合预设条件;

在各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件的情况下,确定环境音频信息表征所述目标噪声场景,其中,所述预设条件为所述能量占比表征的频谱波动情况超过预设波动情况。

在一些实施例中,各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件,可以包括:确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的均值;若所述均值大于均值阈值,则确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件。

在另一些实施例中,各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件,可以包括:确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的标准差;若所述标准差小于标准差阈值,则确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件。

可以理解的是,若各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的均值大于均值阈值,或者各个帧时段的第二噪声子能量与第三噪声子能量的标准差小于标准差阈值,表明该第二环境噪声的频谱信息分布较为均匀,频谱波动较小,可以认定为目标噪声信息。

在一些实施例中,能量占比的标准差低于0.1,以及能量均值高于0.012时,表示检测到目标噪声信息。

如此,通过对各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的均值,以及标准差进一步判断第二环境噪声信息是否为目标噪声信息,可以提高判断的准确性。

作为另一可选的实施例,所述方法还包括:

若所述相关度小于所述相关度阈值,确定所述环境音频信息不表征所述目标噪声场景。

如此,可以减少在电子设备的音视频的参数在电子设备不在所述目标噪声场景下的误调节现象。

进一步地,本公开还提供了一个具体实施例,以进一步理解本公开实施例所提供的信息处理方法。

本实施例所述的方法具体应用于电子设备上,特别是应用在智能电视上;本实施例所述的音频模组包括智能电视的扬声器以及智能电视的麦克风。本实施例的噪声场景以家居噪声场景为例,示例性的,家居噪声例如扫地机器人、电吹风、抽烟机或破壁机的噪声。当用户在观看电视节目时,如果有这些噪声,会需要将电视的音量调大。

请参阅图6,图6是相关技术中基于环境噪声自动调节音量的场景示意图,如图6所示,当智能电视的麦克风收集到家居噪声时,会进行噪声检测,基于噪声检测的检测结果调节音量。相关技术中,噪声检测的准确性较低,通常只对噪声音量进行判断,无法结合场景进行判断,例如,当用户打电话时,噪声音量会增大,如果此时也进行音量的增大调节,显然不符合当前的场景。此外,对于噪声场景的判断往往需要借助较为复杂的神经网络算法等,显然实现起来较为复杂。

基于此,如何实现准确性更高且计算简单的自动音量调节方案成为了亟需解决的技术问题。

请参阅图7,图7是根据一具体实施例示出的基于环境噪声自动调节音量的场景示意图。如图7所示,本实施例中,将噪声检测与分析进行了优化。示例性的,在利用环境声检测信息与扬声器信息进行回声消除过程中,由于存在残余回声信息,因而在噪声能量检测的步骤中,会将残余回声信息的第一频段范围去除,计算的是除去第一频段范围以外频段的环境噪声信息,即上述实施例所述的第二环境噪声信息。如此,不仅可以减少计算量,还可以将残余回声信息去除,提高噪声分析的分析对象的准确性。

在相关度检测时,不仅会将特定场景的声音的第二频段范围去除,而且还会逐帧或逐段进行相关度的平滑比对,即通过上述实施例所述的第一预设子时段的第三环境噪声信息的第一噪声子能量的能量分布,与第二预设子时段的第三环境噪声信息的第二噪声子能量的能量分布的曲线的重合度来比对,可以提高相关度比对的准确性,进而提高噪声分析的准确性。

在相关度大于相关度阈值后,进行频谱波动检测,即只有在各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的均值大于均值阈值,以及各个帧时段的第二噪声子能量与第三噪声子能量的能量占比的标准差小于标准差阈值时,确定第二环境噪声信息为目标噪声信息。即只有在第三环境噪声信息的频谱波动较小,即噪声较为稳定的情况,才确定为家居噪声,例如,电吹风等持续稳定的噪声。

如此,通过噪声能量的检测,相关度检测以及频谱波动检测三重检测后,确定出该环境噪声是否为目标噪声,显然能够提高目标噪声检测的准确性。同时,由于在噪声能量的检测过程中,去除了残余回声信息所在的第一频段,在相关度检测的过程中,去除了特定场景的声音的第二频段,因此,还可以减少计算量。

上述实施例中,实现了在较低计算复杂度下保证目标噪声检测的准确率,优化了相关技术中基于环境噪声自动调节音量的方案,提高了电子设备的听觉体验。

图8是根据一示例性实施例示出的一种信息处理装置,参照图8,该装置包括:

采集模块81,用于在所述电子设备播放音视频过程中,采集环境音频信息;

第一确定模块82,用于对所述环境音频信息进行噪声检测,确定所述环境音频信息是否表征目标噪声场景;

第一处理模块83,用于在所述环境音频信息表征所述目标噪声场景的情况下,对所述电子设备播放的所述音视频的参数进行处理.

在一些可选的实施例中,所述第一确定模块82,还包括:

第一确定子模块,用于根据所述环境音频信息确定第一环境噪声信息;

第二确定子模块,用于在所述第一环境噪声信息包括残余回声信息的情况下,确定所述残余回声信息对应的第一频段范围;

处理子模块,用于根据所述残余回声信息的所述第一频段范围,对所述第一环境噪声信息进行处理得到第二环境噪声信息;

第三确定子模块,用于根据所述第二环境噪声信息,确定所述环境音频信息是否表征所述目标噪声场景。

在一些可选的实施例中,第三确定子模块,还用于:

根据所述第二环境噪声信息,确定第二环境噪声信息的第一噪声能量;

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些可选的实施例中,所述预设时段包括:时长相同且相邻的第一预设子时段和第二预设子时段;

所述第三确定子模块,还用于:

在所述第一噪声能量大于能量阈值,且所述第一噪声能量大于能量阈值的持续时段超过预设时段的情况下,确定所述第一预设子时段的所述第二环境噪声信息与所述第二预设子时段的所述第二环境噪声信息的相关度;

在所述相关度大于或等于相关度阈值的情况下,确定所述环境音频信息表征所述目标噪声场景。

在一些可选的实施例中,所述装置还包括:

第二确定模块,用于在所述第二环境噪声信息包括特定场景的声音信息的情况下,确定特定场景的所述声音信息的第二频段范围;

第二处理模块,用于根据特定场景的所述声音信息的所述第二频段范围,对所述第二环境噪声信息进行处理得到第三环境噪声信息;

所述第三确定子模块,还用于:

确定所述第一预设子时段的所述第三环境噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关度。

在一些可选的实施例中,所述第一预设子时段和所述第二预设子时段均包括:预设数量的帧时段;

所述第三确定子模块,具体用于:

确定所述第一预设子时段的所述第三环境噪声信息中各个帧时段的第一噪声子能量;根据各个帧时段的第一噪声子能量,确定所述第一预设子时段的所述第三环境噪声信息的第一噪声子能量的能量分布;

确定所述第二预设子时段的所述第三环境噪声信息中各个帧时段的第二噪声子能量;根据各个帧时段的第二噪声子能量,确定所述第二预设子时段的所述第三环境噪声信息的第二噪声子能量的能量分布;

根据所述第一噪声子能量的能量分布与所述第二噪声子能量的能量分布,确定所述第一预设子时段的所述第三噪声信息与所述第二预设子时段的所述第三环境噪声信息的相关度。

在一些可选的实施例中,所述装置还包括:

第三确定模块,用于确定所述第二预设子时段的所述第一环境噪声信息的第二噪声能量中各个帧时段的第三噪声子能量;

所述第三确定子模块,还具体用于:

在所述相关度大于或等于所述相关度阈值的情况下,确定各个帧时段的第二噪声子能量与第三噪声子能量的能量占比是否符合预设条件;

在各个帧时段的第二噪声子能量与第三噪声子能量的能量占比符合所述预设条件的情况下,确定环境音频信息表征所述目标噪声场景,其中,所述预设条件为所述能量占比表征的频谱波动情况超过预设波动情况。

在一些可选的实施例中,所述电子设备包括多个扬声器;

所述第一确定子模块,还用于:

根据所述多个扬声器采集的所述环境音频信息,对所述环境音频信息进行回声消除处理,确定所述第一环境噪声信息。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种电子设备900的框图。例如,电子设备900可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图9,电子设备900可以包括以下一个或多个组件:处理组件902,存储器904,电力组件906,多媒体组件908,音频组件910,输入/输出(i/o)的接口912,传感器组件914,以及通信组件916。

处理组件902通常控制电子设备900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在电子设备900的操作。这些数据的示例包括用于在电子设备900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电力组件906为电子设备900的各种组件提供电力。电力组件906可以包括电源管理系统,一个或多个电源,及其他与为电子设备900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述电子设备900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当电子设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(mic),当电子设备900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。

i/o接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器,用于为电子设备900提供各个方面的状态评估。例如,传感器组件914可以检测到电子设备900的打开/关闭状态,组件的相对定位,例如所述组件为电子设备900的显示器和小键盘,传感器组件914还可以检测电子设备900或电子设备900一个组件的位置改变,用户与电子设备900接触的存在或不存在,电子设备900方位或加速/减速和电子设备300的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件916被配置为便于电子设备900和其他设备之间有线或无线方式的通信。电子设备900可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,电子设备900可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由电子设备900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述各实施例所述的信息处理方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1