拾音降噪方法、装置及服务器与流程

文档序号：23985636发布日期：2021-02-20 12:00阅读：118来源：国知局

[0001]
本申请属于语音处理技术领域，具体涉及一种拾音降噪方法、装置及服务器。

背景技术：

[0002]
随着物联网技术的高速发展，人们使用智能家居产品的频率越来越高，在智能家居产品上使用语音唤醒功能也越来越普遍。但是，目前使用的语音唤醒技术在噪声环境下很难成功唤醒设备，或者产生误唤醒，造成唤醒效果差，影响用户体验等瓶颈问题。

技术实现要素：

[0003]
为至少在一定程度上克服目前使用的语音唤醒技术在噪声环境下很难成功唤醒设备，或者产生误唤醒，造成唤醒效果差，影响用户体验的问题，本申请提供一种拾音降噪方法、装置及服务器。
[0004]
第一方面，本申请提供一种拾音降噪方法，包括：
[0005]
建立拾音降噪模型；
[0006]
实时监测唤醒语音；
[0007]
将所述唤醒语音输入所述拾音降噪模型，输出纯净控制指令，以通过所述纯净控制指令驱动电器。
[0008]
进一步的，所述建立拾音降噪模型，包括：
[0009]
获取训练音频；
[0010]
将所述训练音频输入降噪处理模块进行降噪处理，得到处理后音频的时域图曲线和频谱图曲线；
[0011]
调节所述降噪处理模块中降噪参数，生成拾音降噪模型，所述拾音降噪模型输出的音频的时域图曲线和频谱图曲线满足预设要求。
[0012]
进一步的，所述降噪处理模块，包括：
[0013]
冲击噪声滤波算法、周期噪声滤波算法、频带噪声滤波算法和语音干扰噪声滤波算法中的一种或多种。
[0014]
进一步的，所述降噪参数包括：
[0015]
冲击噪声滤波算法、周期噪声滤波算法、频带噪声滤波算法和语音干扰噪声滤波算法中的频段能量参数、频谱中平滑滤波参数。
[0016]
进一步的，所述获取训练音频，包括：
[0017]
采集空调上电后产生的风噪和底噪音频；
[0018]
采集唤醒训练音频；
[0019]
对所述风噪和底噪音频与所述唤醒训练音频进行混音处理，得到训练音频。
[0020]
进一步的，所述采集空调上电后产生的风噪和底噪音频，包括：
[0021]
采用拾音组件采集空调上电后产生的风噪和底噪音频。
[0022]
进一步的，所述拾音组件，包括：
[0023]
驻极体麦克风、拾音孔与拾音结构器件；
[0024]
所述拾音孔与所述驻极体麦克风连接；
[0025]
所述拾音孔与拾音结构器件紧贴。
[0026]
进一步的，所述将所述训练音频输入降噪处理模块进行降噪处理，包括：
[0027]
设置底噪噪声阈值，根据所述底噪噪声阈值滤除电器内部固定频段的干扰噪声。
[0028]
进一步的，所述将所述训练音频输入降噪处理模块进行降噪处理，还包括：
[0029]
提取不同风挡的风噪音频特征点；
[0030]
对所述特征点进行降噪处理。
[0031]
进一步的，所述风挡，包括：
[0032]
静音风挡、低风风挡、中风风挡、高风风挡和强劲风挡。
[0033]
第二方面，本申请提供一种拾音降噪装置，包括：
[0034]
建立模块，用于建立拾音降噪模型；
[0035]
监测模块，用于实时监测唤醒语音；
[0036]
输出模块，用于将所述唤醒语音输入所述拾音降噪模型，输出纯净控制指令，以通过所述纯净控制指令驱动电器。
[0037]
第三方面，本申请提供一种服务器，包括：
[0038]
处理器和存储器，所述处理器用于执行存储器中存储的计算机程序以实现如第一方面中任意一项所述的拾音降噪方法。
[0039]
本申请的实施例提供的技术方案可以包括以下有益效果：
[0040]
本发明实施例提供的拾音降噪方法、装置及服务器，拾音降噪方法包括建立拾音降噪模型；实时监测唤醒语音；将唤醒语音输入拾音降噪模型，输出纯净控制指令，以通过纯净控制指令驱动电器，可以依据各电器机型底噪和风噪的特性曲线对拾音进行降噪优化，提高唤醒率，避免误唤醒，提升用户体验。
[0041]
应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。
附图说明
[0042]
此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。
[0043]
图1为本申请一个实施例提供的一种拾音降噪方法的流程图。
[0044]
图2为本申请另一个实施例提供的一种拾音降噪方法的流程图。
[0045]
图3为本申请另一个实施例提供的一种拾音降噪方法的流程图。
[0046]
图4为本申请一个实施例提供的一种拾音降噪装置的功能结构图。
[0047]
图5为本申请一个实施例提供的一种服务器的结构示意图。
具体实施方式
[0048]
为使本申请的目的、技术方案和优点更加清楚，下面将对本申请的技术方案进行详细的描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有
其它实施方式，都属于本申请所保护的范围。
[0049]
图1为本申请一个实施例提供的拾音降噪方法的流程图，如图1所示，该拾音降噪方法包括：
[0050]
s11：建立拾音降噪模型；
[0051]
s12：实时监测唤醒语音；
[0052]
s13：将唤醒语音输入拾音降噪模型，输出纯净控制指令，以通过纯净控制指令驱动电器。
[0053]
在智能家居产品上使用语音唤醒功能也越来越普遍，而目前使用的语音唤醒技术在噪声环境下很难成功唤醒设备，或者产生误唤醒，造成唤醒效果差，影响用户体验等瓶颈问题。
[0054]
本实施例中，通过建立拾音降噪模型；实时监测唤醒语音；将唤醒语音输入拾音降噪模型，输出纯净控制指令，以通过纯净控制指令驱动电器，可以依据各电器机型底噪和风噪的特性曲线对拾音进行降噪优化，提高唤醒率，避免误唤醒，提升用户体验。
[0055]
本申请一个实施例提供另一种拾音降噪方法，如图2所示流程图，该拾音降噪方法包括：
[0056]
s21：获取训练音频；
[0057]
一些实施例中，如图3所示，获取训练音频可以通过但不限于以下方式实现：
[0058]
s211：采集空调上电后产生的风噪和底噪音频；
[0059]
由于不同电器机型和所处环境的不同，底噪会不同。因此电器上电之后，会优先拾取一段当前环境的底噪音频，在降噪处理模块中进行特征提取和训练学习，以满足各机型各中应用环境的拾音降噪需求。
[0060]
s212：采集唤醒训练音频；
[0061]
s213：对风噪和底噪音频与唤醒训练音频进行混音处理，得到训练音频。
[0062]
s22：将训练音频输入降噪处理模块进行降噪处理，得到处理后音频的时域图曲线和频谱图曲线；
[0063]
一些实施例中，降噪处理模块，包括但不限于以下算法：
[0064]
冲击噪声滤波算法、周期噪声滤波算法、频带噪声滤波算法和语音干扰噪声滤波算法等。
[0065]
通过识别噪声类型选择对应的噪声滤波算法，可以滤除各种音频噪声，适应多种应用场所。
[0066]
一些实施例中，将训练音频输入降噪处理模块进行降噪处理，包括：
[0067]
对于底噪的处理包括：设置底噪噪声阈值，根据底噪噪声阈值滤除电器内部固定频段的干扰噪声。
[0068]
通过预先滤除电器内部固定频段的干扰噪声，可以加快降噪速度。
[0069]
对于风噪的处理包括：将训练音频输入降噪处理模块进行降噪处理，还包括：
[0070]
提取不同风挡的风噪音频特征点；
[0071]
对所述特征点进行降噪处理。
[0072]
风挡，包括：静音风挡、低风风挡、中风风挡、高风风挡和强劲风挡。
[0073]
通过对不同风挡进行针对性降噪处理，可以使降噪效果更加明显。
[0074]
s23：调节降噪处理模块中降噪参数，生成拾音降噪模型，拾音降噪模型输出的音频的时域图曲线和频谱图曲线满足预设要求。
[0075]
降噪参数包括：冲击噪声滤波算法、周期噪声滤波算法、频带噪声滤波算法和语音干扰噪声滤波算法中的频段能量参数、频谱中平滑滤波参数。
[0076]
通过调节频段能量参数、频谱中平滑滤波参数等参数，可以使拾音降噪模型输出的音频的时域图曲线和频谱图曲线噪声点减少，以使拾音降噪模型达到最佳的滤波效果。
[0077]
以空调拾音降噪为例，使用录音设备如两麦驻极体麦克风对空调的五个不同风档和环境底噪进行录音，并对男女使用普通话阅读对话进行录音。用音频处理软件进行混音和剪辑，得到混音音频即训练音频。将混音音频输入到降噪处理模块中进行处理，并适当调节模块参数，最终通过听觉检听对降噪前后的时域图和频谱图进行比较，将降噪后输出时域图和频谱图曲线噪声最少的模型作为最终拾音降噪模型。通过拾音降噪模型进行降噪处理，可以在保证音质损失最小的情况下，获取到更加清晰的有效信息。
[0078]
一些实施例中，采集空调上电后产生的风噪和底噪音频，包括：
[0079]
采用拾音组件采集空调上电后产生的风噪和底噪音频。
[0080]
拾音组件，包括：驻极体麦克风、拾音孔与拾音结构器件；
[0081]
其中拾音孔与所述驻极体麦克风连接，拾音孔与拾音结构器件紧贴。
[0082]
拾音结构器件安装于空调的面板中，拾音孔要求与拾音结构器件紧贴、密封，减少拾音孔到面板的空腔大小，从硬件上减少噪音的拾取。
[0083]
一些实施例中，拾音降噪过程包括：用户发出指令，通过拾音组件拾音，并通过降噪处理模块对带噪的音频进行优化处理，优化后的有效信息即纯净控制指令，通过纯净控制指令驱动空调各运动部件以达到用户要求。
[0084]
本实施例中，对电器各机型底噪和风噪的时域图和频率图中特性曲线进行拾音优化，解决唤醒效果差，长时间运行误唤醒等问题，提高唤醒率精确定位用户痛点，提升语音体验效果，提供更好的智能家居控制体验。
[0085]
图4为本申请一个实施例提供的拾音降噪装置的功能结构图，如图4所示，该拾音降噪装置包括：
[0086]
建立模块41，用于建立拾音降噪模型；
[0087]
监测模块42，用于实时监测唤醒语音；
[0088]
输出模块43，用于将唤醒语音输入拾音降噪模型，输出纯净控制指令，以通过纯净控制指令驱动电器。
[0089]
一些实施例中，还包括：
[0090]
采集模块44，用于采集空调上电后产生的风噪和底噪音频和采集唤醒训练音频；
[0091]
混音处理模块45，用于对风噪和底噪音频与唤醒训练音频进行混音处理，得到训练音频。
[0092]
本实施例中，通过建立模块建立拾音降噪模型，监测模块实时监测唤醒语音，输出模块将唤醒语音输入拾音降噪模型，输出纯净控制指令，以通过纯净控制指令驱动电器，可以依据各电器机型底噪和风噪的特性曲线对拾音进行降噪优化，提高唤醒率，避免误唤醒，提升用户体验。
[0093]
图5为本申请一个实施例提供的服务器的结构示意图，如图5所示，该服务器包括：
[0094]
处理器51和存储器52，
[0095]
处理器51用于执行存储器52中存储的计算机程序以实现如上述实施例中任意一项所述的拾音降噪方法。
[0096]
可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0097]
需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。
[0098]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。
[0099]
应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0100]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0101]
此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0102]
上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0103]
在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0104]
尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
[0105]
需要说明的是，本发明不局限于上述最佳实施方式，本领域技术人员在本发明的启示下都可得出其他各种形式的产品，但不论在其形状或结构上作任何变化，凡是具有与本申请相同或相近似的技术方案，均落在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高宏;文皓;汪进
技术所有人：珠海格力电器股份有限公司
我是此专利的发明人