齿音处理方法、装置、电子设备及存储介质与流程

文档序号：34314126发布日期：2023-05-31 23:10阅读：83来源：国知局

本技术涉及音频处理，具体涉及一种齿音处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术：

1、齿音(ess/sibilance)是指人发出的一切咝擦声，对应于较高的锐度，一般不适宜人耳收听。对于音频采集软件(如，唱歌软件)而言，通常会在获取到的音频数据之后对音频数据中的齿音进行处理，使得音频数据中每帧数据都处于合适的锐度范围内，避免较高锐度的齿音对人耳的听力造成损伤。

2、但是，相关技术中齿音处理方法的实时性较差。

技术实现思路

1、本技术实施例提供一种齿音处理方法、装置、电子设备及存储介质，以提高齿音调节处理的实时性。

2、本技术实施例的一方面提供一种齿音处理方法，包括：获取当前音频帧；确定所述当前音频帧的目标特征值；响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理。

3、在一些实施例中，所述响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理，包括：响应于所述当前音频帧的上一帧为非齿音帧且所述当前音频帧的目标特征值大于或等于第一阈值，确定所述当前音频帧为所述齿音的第一个齿音帧，并将所述当前音频帧的调节参数作为所述齿音的调节参数；基于所述齿音的调节参数设置并开启齿音滤波器，以对所述当前音频帧进行齿音调节处理。

4、在一些实施例中，所述响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理，还包括：响应于所述当前音频帧的上一帧为所述齿音帧且当前音频帧的目标特征值大于或等于所述第一阈值，确定所述当前音频帧为所述齿音的除第一个齿音帧外的其余齿音帧，将所述齿音的调节参数保持为所述齿音的第一个齿音帧的调节参数；保持所述齿音滤波器的开启状态，以对所述当前音频帧进行齿音调节处理。

5、在一些实施例中，所述方法还包括：响应于所述当前音频帧的上一帧为所述齿音帧且所述当前音频帧的目标特征值小于所述第一阈值，确定所述当前音频帧为非齿音帧，并停止所述齿音滤波器。

6、在一些实施例中，所述方法还包括：响应于所述当前音频帧的上一帧为所述非齿音帧且所述当前音频帧的目标特征值小于所述第一阈值，确定所述当前音频帧为非齿音帧，并保持所述齿音滤波器的停止状态。

7、在一些实施例中，所述确定所述当前音频帧的目标特征值，包括：获取所述当前音频帧的初始特征值；对所述初始特征值进行平滑处理，得到所述当前音频帧的目标特征值。

8、在一些实施例中，所述对所述初始特征值进行平滑处理，得到所述当前音频帧的目标特征值，包括：基于所述当前音频帧的帧长，确定用于进行平滑处理的音频帧的数量m；获取所述当前音频帧之前的m-1个音频帧的目标特征值；基于所述m-1个音频帧的目标特征值对所述当前音频帧的初始特征值进行平滑处理，得到所述当前音频帧的目标特征值。

9、在一些实施例中，所述方法还包括：基于所述当前音频帧的目标特征值，在显示界面显示所述目标特征值随时间变化的第一图像。

10、在一些实施例中，所述齿音的调节参数包括：齿音能量集中处的中心频率以及需要进行所述齿音调节处理的所述齿音的作用频带，所述方法还包括：确定所述当前音频帧的响度；基于所述响度确定所述当前音频帧的齿音能量集中处的中心频率以及所述当前音频帧的能量衰减到所述预设衰减比率时的作用带宽；基于所述作用带宽和所述能量集中处的中心频率，确定所述当前音频帧的作用频带。

11、在一些实施例中，所述方法还包括：基于所述当前音频帧的作用带宽以及所述当前音频帧的齿音能量集中处的中心频率，在显示界面显示所述齿音的作用带宽以及所述齿音的齿音能量集中处的中心频率。

12、在一些实施例中，所述齿音的调节参数还包括：所述齿音调节处理的响应时间以及所述齿音调节处理的最大衰减量，所述方法还包括：获取由显示界面输入的所述齿音调节处理的响应时间以及所述齿音调节处理的滤除比例；基于所述滤除比例以及预设齿音调节处理的触发阈值，确定所述齿音调节处理的最大衰减量。

13、在一些实施例中，所述确定所述当前音频帧的目标特征值，包括：响应于所述当前音频帧的帧能量大于第二阈值且所述当前音频帧的过零率大于第三阈值，确定所述当前音频帧的目标特征值。

14、在一些实施例中，所述目标特征值包括用于衡量声音尖锐程度的锐度。

15、在一些实施例中，所述获取当前音频帧，包括：通过实时音频采集设备采集所述当前音频帧。

16、本技术实施例的另一方面提供一种齿音处理装置，包括：获取单元，用于获取当前音频帧；确定单元，用于确定所述当前音频帧的目标特征值；处理单元，用于响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理。

17、在一些实施例中，所述处理单元在用于所述响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理时，还进一步用于：响应于所述当前音频帧的上一帧为非齿音帧且所述当前音频帧的目标特征值大于或等于第一阈值，确定所述当前音频帧为所述齿音的第一个齿音帧，并将所述当前音频帧的调节参数作为所述齿音的调节参数；基于所述齿音的调节参数设置并开启齿音滤波器，以对所述当前音频帧进行齿音调节处理。

18、在一些实施例中，所述处理单元在用于所述响应于所述当前音频帧的目标特征值满足预设条件，确定所述当前音频帧属于齿音的齿音帧，并确定所述齿音的调节参数，基于所述齿音的调节参数对所述当前音频帧进行齿音调节处理时，还进一步用于：响应于所述当前音频帧的上一帧为所述齿音帧且当前音频帧的目标特征值大于或等于所述第一阈值，确定所述当前音频帧为所述齿音的除第一个齿音帧外的其余齿音帧，将所述齿音的调节参数保持为所述齿音的第一个齿音帧的调节参数；保持所述齿音滤波器的开启状态，以对所述当前音频帧进行齿音调节处理。

19、在一些实施例中，所述处理单元还用于响应于所述当前音频帧的上一帧为所述齿音帧且所述当前音频帧的目标特征值小于所述第一阈值，确定所述当前音频帧为非齿音帧，并停止所述齿音滤波器。

20、在一些实施例中，所述处理单元还用于响应于所述当前音频帧的上一帧为所述非齿音帧且所述当前音频帧的目标特征值小于所述第一阈值，确定所述当前音频帧为非齿音帧，并保持所述齿音滤波器的停止状态。

21、在一些实施例中，所述确定单元在用于所述确定所述当前音频帧的目标特征值时，还进一步用于：获取所述当前音频帧的初始特征值；对所述初始特征值进行平滑处理，得到所述当前音频帧的目标特征值。

22、在一些实施例中，所述确定单元在用于所述对所述初始特征值进行平滑处理，得到所述当前音频帧的目标特征值时，还进一步用于：基于所述当前音频帧的帧长，确定用于进行平滑处理的音频帧的数量m；获取所述当前音频帧之前的m-1个音频帧的目标特征值；基于所述m-1个音频帧的目标特征值对所述当前音频帧的初始特征值进行平滑处理，得到所述当前音频帧的目标特征值。

23、在一些实施例中，所述装置还包括：第一显示单元，用于基于所述当前音频帧的目标特征值，在显示界面显示所述目标特征值随时间变化的第一图像。

24、在一些实施例中，所述齿音的调节参数包括：齿音能量集中处的中心频率以及需要进行所述齿音调节处理的所述齿音的作用频带，所述装置还包括：第一参数确定单元，用于确定所述当前音频帧的响度；基于所述响度确定所述当前音频帧的齿音能量集中处的中心频率以及所述当前音频帧的能量衰减到所述预设衰减比率时的作用带宽；基于所述作用带宽和所述能量集中处的中心频率，确定所述当前音频帧的作用频带。

25、在一些实施例中，所述装置还包括：第二显示单元，用于基于所述当前音频帧的作用带宽以及所述当前音频帧的齿音能量集中处的中心频率，在显示界面显示所述齿音的作用带宽以及所述齿音的齿音能量集中处的中心频率。

26、在一些实施例中，所述齿音的调节参数还包括：所述齿音调节处理的响应时间以及所述齿音调节处理的最大衰减量，所述装置还包括：第二参数确定单元，用于获取由显示界面输入的所述齿音调节处理的响应时间以及所述齿音调节处理的滤除比例；基于所述滤除比例以及预设齿音调节处理的触发阈值，确定所述齿音调节处理的最大衰减量。

27、在一些实施例中，所述确定单元在用于所述确定所述当前音频帧的目标特征值时，还进一步用于：响应于所述当前音频帧的帧能量大于第二阈值且所述当前音频帧的过零率大于第三阈值，确定所述当前音频帧的目标特征值。

28、在一些实施例中，所述目标特征值包括用于衡量声音尖锐程度的锐度。

29、在一些实施例中，所述获取单元在用于所述获取当前音频帧时，还进一步用于：通过实时音频采集设备采集所述当前音频帧。

30、本技术实施例的另一方面提供一种电子设备，包括：处理器；以及存储器，用于存储处理器的可执行指令；其中，处理器配置为经由执行可执行指令来执行如上任一实施例所述的方法。

31、本技术实施例的另一方面提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现如上任一实施例所述的方法。

32、本技术实施例的另一方面提供一种计算机程序产品，包括计算机程序，其特征在于，计算机程序被处理器执行时实现如上任一实施例所述的方法。

33、本技术实施例提供的齿音处理方法、装置、电子设备及存储介质，通过获取当前音频帧；确定当前音频帧的目标特征值；响应于当前音频帧的目标特征值满足预设条件，确定当前音频帧属于齿音的齿音帧，并确定齿音的调节参数，基于齿音的调节参数对当前音频帧进行齿音调节处理，从而可以针对每一个音频帧来判断其是否是齿音，若是则对该音频帧进行齿音调节处理，从而可以逐帧地消除齿音，提高音频的质量。由于本技术实施例提供的齿音处理方法可以逐帧地进行齿音的检测以及调节处理，从而可以应用于对实时性要求较高的实时场景中，即可以根据实时获取到的每一音频帧进行齿音的检测及调节处理，提高了齿音调节处理的实时性。同时，齿音处理方法还可以应用于对实时性要求不高的录播场景中，以对录音文件中的每一音频帧进行齿音的检测以及调节处理，提高了齿音处理方法的场景多样性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：熊贝尔郑毅郑博刘华平
技术所有人：杭州网易云音乐科技有限公司
我是此专利的发明人

上一篇：面向融合控制的制动系统及方法与流程
上一篇：除菌除螨除臭喷雾及其制备方法与流程