一种音频处理方法、装置、智能音箱及存储介质与流程

文档序号：14480429阅读：236来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本发明实施例涉及语音处理技术，尤其涉及一种音频处理方法、装置、智能音箱及存储介质。

背景技术：

敲门声或门铃声是客人向主人发出的有客人到访的声音提醒。随着隔音技术的发展，房门的隔音效果越来越好，房间里的主人可能会听不到敲门声或门铃声，尤其是主人所在房间处于嘈杂的环境中或主人在房间睡觉的情况，听到敲门声或门铃声的可能性更小。

技术实现要素：

本发明实施例提供一种音频处理方法、装置、智能音箱及存储介质，解决主人在房间听不到敲门声的问题。

第一方面，本发明实施例提供了一种音频处理方法，该方法包括：

接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配；

当所述第一音频信号与所述第一预设音频信号标准库相匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，应用第三预设音频信号标准库进行提示。

进一步地，该方法还包括：

当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

进一步地，所述第一预设音频信号标准库包括敲门声音或门铃声音，所述第二预设音频信号标准库包括开门声音。

进一步地，所述第一预设音频信号标准库包括脚步声音，所述第二预设音频信号标准库包括敲门声音或门铃声音。

进一步地，该方法还包括：

在第一预设时间内检测第二音频信号与第二预设音频信号标准库不匹配时，在第二预设时间内检测第四音频信号是否与第四预设音频信号标准库相匹配；

当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第二音频信号更新至所述第二预设音频信号标准库。

进一步地，该方法还包括：

当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，在第二预设时间段内检测第四音频信号是否与第四预设音频信号标准库相匹配；

当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

进一步地，该方法还包括：

当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库不匹配时，在第二预设时间段内检测第四音频信号是否与第四预设音频信号标准库相匹配；

当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库，并将所述第二音频信号更新至所述第二预设音频信号标准库。

其中，所述第四预设音频信号标准库包括开门声音。

第二方面，本发明实施例还提供了一种智能音箱，该智能音箱包括：

至少一个麦克风；

至少一个扬声器；

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例第一方面任一所述的音频处理方法。

第三方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例第一方面任一所述的音频处理方法。

本发明实施例通过在第一音频信号与第一预设音频信号标准库相匹配时，并在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，采用第三预设音频信号标准库进行提示，实现了通过对第一音频信号和第二音频信号的监听，保证在第一音频信号与第二音频信号分别与第一预设音频信号标准库和第二预设音频标准库相匹配时，采用第三预设音频信号标准库进行提示房间内的用户，以使得用户知晓第一音频信号和第二音频信号的发生，从而实现提示用户的作用，保证在用户所在房间嘈杂的情况下用户依然知晓特定声音的发生，提高用户体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种音频处理方法的流程示意图；

图2是本发明实施例二提供的一种音频处理方法的流程示意图；

图3是本发明实施例三提供的一种音频处理方法的流程示意图；

图4是本发明实施例四提供的一种音频处理方法的流程示意图；

图5是本发明实施例五提供的一种音频处理方法的流程示意图；

图6是本发明实施例六提供的一种音频处理装置的结构示意图；

图7是本发明实施例七提供的一种智能音箱的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下将参照本发明实施例中的附图，通过实施方式清楚、完整地描述本发明的技术方案，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1是本发明实施例一提供的一种音频处理方法的流程图。本实施例的技术方案可以适用于将敲门声提示给用户的情况。该方法可以由本发明实施例提供的一种音频处理装置来执行，该装置可以采用软件和/或硬件的方式实现，并配置于智能音箱中应用。该方法具体包括如下操作：

s110、接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配。

示例性，所述第一预设音频信号标准库包括脚步声音，所述第二预设音频信号标准库包括敲门声音或门铃声音。

通过采集音频信号的设备采集第一音频信号，所述采集音频信号的设备例如可以是音箱。第一预设音频信号标准库例如可以是预先采集的不同人的不同的脚步声音，通过机器学习算法对脚步声音进行学习，得到的脚步声音模型。第一音频信号与第一预设音频信号标准库匹配可以是：将第一音频信号与脚步声音模型匹配，匹配值超过预设阈值可以确定第一音频信号与第一预设音频信号标准库匹配成功，第一音频信号为脚步声音。第一音频信号与第一预设音频信号标准库匹配还可以是：对第一音频信号与第一预设音频信号标准库中的每一个人的脚步声音进行声纹特征提取，将第一音频信号的声纹特征与每一个人的脚步声音对应的声纹特征进行特征匹配，当二者匹配值大于预设阈值时，可以确定第一音频信号为某人的脚步声音，这种方式可以具体确定脚步声音对应的人的信息。

s120、当所述第一音频信号与所述第一预设音频信号标准库相匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配。

以第一预设音频信号标准库包括脚步声音，第二预设音频信号标准库包括敲门声音或门铃声音为例，在确定第一音频信号为脚步声音时，在第一预设时间段内检测第二音频信号是否为敲门声音或门铃声音，检测方式参照检测第一音频信号的方式。其中，第一预设时间可以根据接收到第一音频信号时第一音频信号所处位置与门的位置，以成人平均步行速度计算从第一音频信号所处位置到门的位置，成人所需要消耗的时间，第一预设时间可以是计算出的成人所需要消耗的时间，也可以是该时间的倍数，但是不能太长，太长不能保证监测到第二音频信号。

s130、当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，应用第三预设音频信号标准库进行提示。

当确定第二音频信号为敲门声音或门铃声音时，从第三预设音频信号标准库中选择提示语音提示用户。提示语音例如可以是“主人有人来了”，也可以根据用户喜好，自主生成提示语音。

在本实施例的另一实施方式中，所述第一预设音频信号标准库包括敲门声音或门铃声音，所述第二预设音频信号标准库包括开门声音。第三预设音频信号标准库中包括的提示语音可以是：“欢迎回家”。

当第一预设音频标准库为敲门声音或门铃声音，第二预设音频信号为开门声音时，该实施例的方法还可以是：

接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配；

当所述第一音频信号与所述第一预设音频信号标准库相匹配时，在第一预设时间段内检测是否存在第二音频信号，所述第二音频信号与第二预设音频信号标准库相匹配；

当在第一预设时间段内不存在所述第二音频信号时，应用第三预设音频信号标准库进行提示。

当音箱检测到敲门声音之后，一段时间内没有检测到开门声音，则可以应用提示语音提示用户，当音箱正在播放音乐时，还可以自动静音或降低音乐播放的音量。当用户所处房间的环境嘈杂时，可以采用此种方式提示用户有人在敲门，方便用户去开门。

实施例二

图2是本发明实施例二提供的一种音频处理方法的流程图。本发明实施例在上述实施例的基础上，增加了当所述第一音频信号与所述第一预设音频信号标准库不匹配时的操作。

相应地，本实施例的方法包括：

s210、接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配。

s220、当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配。

s230、当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

以第一预设音频信号为脚步声音，第二预设音频信号为敲门声音或门铃声音时，当第一预设音频信号标准库不包含第一音频信号时，且第二音频信号为敲门声音或门铃声音时，可以确定第一音频信号为脚步声音，将第一音频信号更新至第一预设音频标准库，实现第一预设音频信号标准库包含的脚步声音的特征更加丰富，提高确定第一音频信号为脚步声音的准确率。

本发明实施例通过在第一音频信号与第一预设音频信号标准库不匹配，且第二音频信号与第二预设音频信号标准库匹配时，将第一音频信号更新至第一预设音频信号标准库中，实现了对第一预设音频信号标准库的实时更新，提高第一音频信号确定的准确率。

实施例三

图3是本发明实施例三提供的一种音频处理方法的流程图。本发明实施例在上述实施例的基础上，增加了当所述第二音频信号与所述第二预设音频信号标准库不匹配时的操作。

相应地，本实施例的方法包括：

s310、接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配。

s320、当所述第一音频信号与所述第一预设音频信号相匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配。

s330、当在第一预设时间段内第二音频信号与第二预设音频信号标准库不匹配时，在第二预设时间内检测第四音频信号是否与第四预设音频信号标准库相匹配。

s340、当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第二音频信号更新至所述第二预设音频信号标准库。

其中，所述第四预设音频信号标准库包括开门声音。

以第一预设音频信号标准库包括脚步声音，第二预设音频信号标准库包括门铃声音或敲门声音，第四预设音频信号标准库包括开门声音为例：

当第一预设音频信号标准库包括第一音频信号，即第一音频信号为脚步声音，第二预设音频信号标准库不包括第二音频信号，但是第四音频信号为开门声音时，可以确定第二音频信号为敲门声音或门铃声音，将第二音频信号更新至第二预设音频信号标准库。由此实现第二预设音频信号标准库包含的敲门声音或门铃声音的特征更加丰富，提高确定第二音频信号为开门声音的准确率。

本发明实施例通过在第一音频信号与第一预设音频信号标准库匹配，且第二音频信号与第二预设音频信号标准库不匹配时，第四音频信号与第四预设音频信号标准库匹配时，将第二音频信号更新至第二预设音频信号标准库中，实现了对第二预设音频信号标准库的实时更新，提高第二音频信号确定的准确率。

实施例四

图4是本发明实施例四提供的一种音频处理方法的流程图。本发明实施例在上述实施例的基础上，增加了当所述第一音频信号与所述第一预设音频信号标准库不匹配时的操作。

相应地，本实施例的方法包括：

s410、接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配。

s420、当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配。

s430、当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，在第二预设时间段内检测第四音频信号是否与第四预设音频信号标准库相匹配。

s440、当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

以第一预设音频信号标准库包括脚步声音，第二预设音频信号标准库包括门铃声音或敲门声音，第四预设音频信号标准库包括开门声音为例：

当第一预设音频信号标准库不包括第一音频信号，第二预设音频信号标准库包括第二音频信号，即第二音频信号为敲门声音或门铃声音，第四音频信号为开门声音时，可以确定第一音频信号为脚步声音，将第一音频信号更新至第一预设音频信号标准库。由此实现第一预设音频信号标准库包含的脚步声音的特征更加丰富，提高确定第一音频信号为开门声音的准确率。

本发明实施例通过在第一音频信号与第一预设音频信号标准库不匹配，第二音频信号与第二预设音频信号标准库匹配，第四音频信号与第四预设音频信号标准库匹配时，将第一音频信号更新至第一预设音频信号标准库中，实现了对第一预设音频信号标准库的实时更新，提高第一音频信号确定的准确率。

实施例五

图5是本发明实施例五提供的一种音频处理方法的流程图。本发明实施例在上述实施例的基础上，增加了当所述第一音频信号与所述第一预设音频信号标准库不匹配时的操作。

相应地，本实施例的方法包括：

s510、接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配。

s520、当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配。

s530、当在第一预设时间段内第二音频信号与第二预设音频信号标准库不匹配时，在第二预设时间段内检测第四音频信号是否与第四预设音频信号标准库相匹配。

s540、当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库，并将所述第二音频信号更新至所述第二预设音频信号标准库。

以第一预设音频信号标准库包括脚步声音，第二预设音频信号标准库包括门铃声音或敲门声音，第四预设音频信号标准库包括开门声音为例：

当第一预设音频信号标准库不包括第一音频信号，第二预设音频信号标准库不包括第二音频信号，第四音频信号为开门声音时，可以确定第一音频信号为脚步声音，第二音频信号为敲门声音或门铃声音，将第一音频信号更新至第一预设音频信号标准库且将第二音频信号更新至第二预设音频信号标准库。由此实现第一预设音频信号标准库包含的脚步声音的特征更加丰富，第二预设音频信号标准库包含的敲门声音或门铃声音特征更加丰富，提高确定第一音频信号为开门声音和第二音频信号为敲门声音或门铃声音的准确率。

本发明实施例通过在第一音频信号与第一预设音频信号标准库不匹配，第二音频信号与第二预设音频信号标准库不匹配，第四音频信号与第四预设音频信号标准库匹配时，将第一音频信号更新至第一预设音频信号标准库中，将第二音频信号更新至第二预设音频信号标准库中，实现了对第一预设音频信号和第二预设音频信号标准库的实时更新，提高第一音频信号和第二音频信号确定的准确率。

实施例六

图6是本发明实施例六提供的一种音频处理装置的结构框图。该装置用于执行上述任意实施例所提供的一种音频处理方法。该装置包括：

第一音频信号接收模块610，用于接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配；

第二音频信号匹配模块620，用于当所述第一音频信号与所述第一预设音频信号标准库相匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

提示模块630，用于当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，应用第三预设音频信号标准库进行提示。

进一步地，该装置还包括：第一更新模块，用于：

当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

其中，所述第一预设音频信号标准库包括敲门声音或门铃声音，所述第二预设音频信号标准库包括开门声音。

其中，所述第一预设音频信号标准库包括脚步声音，所述第二预设音频信号标准库包括敲门声音或门铃声音。

进一步地，该装置还包括：第二更新模块，用于：

当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第二音频信号更新至所述第二预设音频信号标准库。

进一步地，该装置还包括：第三更新模块，用于：

当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第二预设时间段内第四音频信号与第四预设音频信号标准库相匹配时，将所述第一音频信号更新至所述第一预设音频信号标准库。

进一步地，该装置还包括：第四更新模块，用于：当所述第一音频信号与所述第一预设音频信号标准库不匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

其中，所述第四预设音频信号标准库包括开门声音。

本发明实施例六提供的音频处理装置，采用第三预设音频信号标准库进行提示房间内的用户，以使得用户知晓第一音频信号和第二音频信号的发生，从而实现提示用户的作用，保证在用户所在房间嘈杂的情况下用户依然知晓特定声音的发生，提高用户体验。

本发明实施例所提供的音频处理装置可执行本发明任意实施例所提供的音频处理方法，具备执行方法相应的功能模块和有益效果。

实施例七

图7为本发明实施例七提供的一种智能音箱的结构示意图，如图7所示，该智能音箱包括至少一个麦克风，至少一个扬声器和处理器70、存储器71、输入装置72和输出装置73；设备中处理器70的数量可以是一个或多个，图7中以一个处理器70为例；设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接，图7中以通过总线连接为例。

存储器71作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的音频处理方法对应的程序指令/模块(例如，第一音频信号接收模块610、第二音频信号匹配模块620和提示模块630)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的音频处理方法。

存储器71主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器71可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器71可进一步包括相对于处理器70远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置72可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。

实施例八

本发明实施例八还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种音频处理方法，该方法包括：

接收第一音频信号，并判断所述第一音频信号是否与第一预设音频信号标准库相匹配；

当所述第一音频信号与所述第一预设音频信号相匹配时，在第一预设时间段内检测第二音频信号是否与第二预设音频信号标准库相匹配；

当在第一预设时间段内第二音频信号与第二预设音频信号标准库相匹配时，应用第三预设音频信号标准库进行提示。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的音频处理方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李承敏;段举;卫立峰;朱发
技术所有人：上海乐愚智能科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。