环境音分类方法、电子设备及存储介质与流程

文档序号：37216766发布日期：2024-03-05 15:07阅读：13来源：国知局

本发明涉及音频处理，特别是涉及一种环境音分类方法、电子设备及存储介质。

背景技术：

1、环境问题直接影响着人们的生活。在真实的环境中有各种各样的噪声，由许多不同的生活事物和其他事物产生，不同的环境场所包含的噪声类型大不相同。同一噪声类型的噪声特性也存在差别，有的属于平稳噪声，有的属于准平稳噪声，有的属于非平稳噪声。真实环境中，环境噪声谱特性是不断变化的。对于主动降噪技术来说，能够确定当前所处环境的噪声类型，对后续的降噪处理有很大的帮助，可依据不同的噪声类型进行有针对性的降噪。

2、传统的基于语音活动性检测(voice activity detectors，vad)的噪声功率谱估计方法只适用于平稳噪声，而且是有偏估计。亟须提供一种能跟踪非平稳噪声功率谱的快速变化，且减少估计误差的噪声功率谱估计方法，从而提高对环境音分类的准确度。

技术实现思路

1、本发明实施例旨在提供一种环境音分类方法、电子设备及存储介质，以解决现有技术中的噪声功率谱估计方法不能跟踪非平稳噪声功率谱的快速变化且是有偏估计，导致环境音的分类准确度不高的问题。

2、为解决上述技术问题，本发明实施例提供以下技术方案：

3、根据本发明的一方面，提供一种环境音分类方法，所述方法包括：

4、将环境音经过预处理后变换到频域，计算出所述环境音的初始频谱周期图；

5、计算后验环境音存在概率，基于所述环境音的初始频谱周期图和所述后验环境音存在概率采用最小均方误差方法估计环境声功率谱；

6、计算所述环境声功率谱在预设的伽马通滤波器中的伽马通能量，对所述伽马通能量进行非线性压缩和离散余弦变换提取apncc系数；

7、基于所述apncc系数对所述环境音进行分类。

8、可选地，所述计算后验环境音存在概率的公式为：

9、

10、其中，λ为帧序号，k为频率分量索引，k＝1，2，……，l/2+1，l为环境音进行快速傅里叶变换的长度；np(λ，k)为当前帧频率分量索引k的频谱；npd(λ-1，k)为上一帧频率分量索引k的环境声功率谱；ζ为预设的最优先验概率。

11、可选地，所述方法还包括：

12、对所述后验环境音存在概率基于下式进行平滑：

13、αs(λ，k)＝βαs(λ-1，k)+(1-β)αs(λ，k)

14、进一步对平滑得到的αs(λ，k)采用下式进行调整：

15、αs(λ，k)＝min(0.99，αs(λ，k))

16、其中，β为平滑常数。

17、可选地，所述基于所述环境音的初始频谱周期图和所述后验环境音存在概率采用最小均方误差方法估计环境声功率谱的公式为：

18、npd(λ，k)＝αpnpd(λ-1，k)+(1-αp)mms(λ，k)

19、其中，αp为大于0小于1的常数，mms(λ，k)为环境音的估计频谱周期图，其计算公式为：

20、mms(λ，k)＝(1-αs(λ，k))np(λ，k)+αs(λ，k)npd(λ-1，k)。

21、可选地，所述方法还包括：

22、确定所述伽马通滤波器的通道数量和各滤波器通道的中心频率，所述各滤波器通道的中心频率fg的计算公式为：

23、fg＝-228.8+exp(g(-ln(fmax+228.8)+ln(fmin+228.8))/n)(fmax+228.8)

24、其中，g为滤波器通道索引，g＝1，2，……，n，n为滤波器的通道数量，fmax为最大中心频率，fmin为最小中心频率。

25、可选地，所述计算所述环境声功率谱在伽马通滤波器中的伽马通能量的公式为：

26、

27、其中，gtm(k，g)为第g个滤波器对第k个频率分量索引的冲激响应值。

28、可选地，所述对所述伽马通能量进行非线性压缩的公式为：

29、y(λ，g)＝a(xgam(λ，g))u

30、进一步地，对y(λ，g)进行离散余弦变换提取apncc系数的公式为：

31、

32、其中，a为常数，u为乘幂值，取值在0～1之间；i是apncc系数的索引，i＝1，2，...，i且1≤i≤n，i是每一帧的apncc系数的个数。

33、可选地，所述方法还包括：

34、通过下式对所述apncc系数c(λ，i)进行升半正弦倒谱提升得到改进后的apncc系数：

35、

36、根据本发明的另一方面，提供一种电子设备，包括存储器、处理器及存储在存储器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的环境音分类方法的步骤。

37、根据本发明的再一方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被处理器执行时，所述处理器执行上述任一项所述的环境音分类方法的步骤。

38、本发明实施例的有益效果是：区别于现有技术的情况，本发明实施例中，提供了一种环境音分类方法，首先，将环境音经过预处理后变换到频域，计算出所述环境音的初始频谱周期图；再计算后验环境音存在概率，基于所述环境音的初始频谱周期图和所述后验环境音存在概率采用最小均方误差方法估计环境声功率谱；然后，计算所述环境声功率谱在预设的伽马通滤波器中的伽马通能量，对所述伽马通能量进行非线性压缩和离散余弦变换提取apncc系数；最后，基于所述apncc系数对所述环境音进行分类。本发明的方法，能快速跟踪一般非平稳噪声的功率谱，减少了对环境声功率谱的过高和过低估计造成的谱估计误差，提高了环境音分类的准确度。

技术特征：

1.一种环境音分类方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述计算后验环境音存在概率的公式为：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述环境音的初始频谱周期图和所述后验环境音存在概率采用最小均方误差方法估计环境声功率谱的公式为：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述计算所述环境声功率谱在伽马通滤波器中的伽马通能量的公式为：

7.根据权利要求6所述的方法，其特征在于，所述对所述伽马通能量进行非线性压缩的公式为：

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1-8任一项所述的环境音分类方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被处理器执行时，所述处理器执行如权利要求1-8任一项所述的环境音分类方法的步骤。

技术总结
本发明实施例公开了一种环境音分类方法、电子设备及存储介质，其中方法包括：将环境音经过预处理后变换到频域，计算出所述环境音的初始频谱周期图；计算后验环境音存在概率，基于所述环境音的初始频谱周期图和所述后验环境音存在概率采用最小均方误差方法估计环境声功率谱；计算所述环境声功率谱在预设的伽马通滤波器中的伽马通能量，对所述伽马通能量进行非线性压缩和离散余弦变换提取APNCC系数；基于所述APNCC系数对所述环境音进行分类。采用本发明的方法，能快速跟踪一般非平稳噪声的功率谱，减少了对环境声功率谱的估计误差，提高了环境音分类的准确度。

技术研发人员：韦莎丽,曹宇韬,宋明辉,王红丽
受保护的技术使用者：深圳市中科蓝讯科技股份有限公司
技术研发日：
技术公布日：2024/3/4

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韦莎丽,曹宇韬,宋明辉,王红丽
技术所有人：深圳市中科蓝讯科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。