音箱控制方法及装置与流程

文档序号：18945491发布日期：2019-10-23 01:32阅读：225来源：国知局

本公开涉及智能家居技术领域，尤其涉及音箱控制方法及装置。

背景技术：

智能音箱有蓝牙功能，可以通过蓝牙技术连接手机，进而播放手机中的歌曲。当用户向智能音箱输入语音“播放音乐”时，智能音箱会蓝牙搜索周围的终端，例如手机，当搜索到多个终端时，需要用户进行选择操作，选择出需要连接的终端，然后就可以通过蓝牙技术连接该设备，并从该设备获取音频数据进行播放。

技术实现要素：

本公开实施例提供一种音箱控制方法及装置。所述技术方案如下：

根据本公开实施例的第一方面，提供一种音箱控制方法，包括：

接收语音指令；

提取所述语音指令中语音的第一声纹特征；

比对所述第一声纹特征与预存在声纹库中的声纹特征；

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并执行所述语音指令。

在一个实施例中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，包括：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描并建立无线连接；

或者

在所述接收到语音指令之后，还包括：

执行终端扫描操作，确定能够进行连接的终端的终端标识；

则，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，包括：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；从扫描到的终端标识中确定与所述第二声纹特征对应的终端标识；响应于扫描到的终端标识中存在与所述第二声纹特征对应的终端标识，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接。

在一个实施例中，响应于所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，所述方法还包括：

输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接；

获取提供的所述第一声纹特征对应的终端标识；

与所述提供的终端标识所标识的终端建立无线连接。

在一个实施例中，响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，所述方法还包括：

将所述第一声纹特征存储至所述声纹库中；并

对应存储确定的所述第一声纹特征对应的终端标识。

在一个实施例中，响应于所述第二声纹特征对应至少两个终端标识，所述方法还包括：

输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

获取选择的终端标识；并

与所选择的终端标识所标识的终端建立无线连接。

在一个实施例中，所述语音指令用于指示进行音频播放，且并未指定具体播放内容；

执行所述语音指令，包括：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

根据本公开实施例的第三方面，提供一种音箱控制装置，包括：

接收模块，用于接收语音指令；

提取模块，用于提取所述语音指令中语音的第一声纹特征；

比对模块，用于比对所述第一声纹特征与预存在声纹库中的声纹特征；

响应模块，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接；

执行模块，用于执行所述语音指令。

在一个实施例中，所述响应模块包括第一响应子模块；其中：

第一响应子模块，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描并建立无线连接；

或者，

所述装置还包括：扫描模块，相应的，所述响应模块包括第二响应子模块；其中：

扫描模块，用于执行终端扫描操作，确定能够进行连接的终端的终端标识；

第二响应子模块，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；

确定子模块，用于从扫描到的终端标识中确定与所述第二声纹特征对应的终端标识；

第三响应子模块，用于响应于扫描到的终端标识中存在与所述第二声纹特征对应的终端标识，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接。

在一个实施例中，所述装置还包括：

第一输出模块，用于响应于所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接时，输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接；

第一获取模块，用于获取提供的所述第一声纹特征对应的终端标识；

第一建立模块，用于与所述提供的终端标识所标识的终端建立无线连接。

在一个实施例中，所述装置还包括：

存储模块，用于响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，将所述第一声纹特征存储至所述声纹库中，并对应存储确定的所述第一声纹特征对应的终端标识。

在一个实施例中，所述装置还包括：

第二输出模块，用于响应于所述第二声纹特征对应至少两个终端标识，输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

第二获取模块，用于获取选择的终端标识；

第二建立模块，用于与所述选择的终端标识对应的终端建立无线连接。

在一个实施例中，所述语音指令用于指示进行音频播放，且并未指定具体播放内容；所述执行模块包括：

第四响应子模块，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

根据本公开实施例的第三方面，提供一种音箱控制装置，包括：

处理器；用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行上述方法中的步骤。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，存储有计算机指令，所述计算机指令被处理器执行时实现上述方法中的步骤。

本公开的实施例提供的技术方案可以包括以下有益效果：本实施例可以在接收到语音指令时，提取所述语音指令中语音的第一声纹特征；比对所述第一声纹特征与预存在声纹库中的声纹特征；响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并执行所述语音指令。如此，预先记录声纹特征对应的终端标识，当收到该用户的语音指令时，不需要用户选择，可以自动根据声纹特征确定该用户使用的终端并进行连接以执行语音指令，提高音箱的使用效率，提升用户体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种音箱控制方法的流程图。

图2是根据一示例性实施例示出的一种音箱控制方法的流程图。

图3是根据一示例性实施例示出的一种音箱控制方法的流程图。

图4是根据一示例性实施例示出的一种音箱控制装置的框图。

图5是根据一示例性实施例示出的一种音箱控制装置的框图。

图6是根据一示例性实施例示出的一种音箱控制装置的框图。

图7是根据一示例性实施例示出的一种音箱控制装置的框图。

图8是根据一示例性实施例示出的一种音箱控制装置的框图。

图9是根据一示例性实施例示出的一种音箱控制装置的框图。

图10是根据一示例性实施例示出的一种音箱控制装置的框图。

图11是根据一示例性实施例示出的一种音箱控制装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

目前，当智能音箱搜索到多个终端时，需要用户帮助进行选择，降低了播放效率，并且用户体验不好。

为了解决上述问题，本实施例可以在接收到语音指令时，提取所述语音指令中语音的第一声纹特征；比对所述第一声纹特征与预存在声纹库中的声纹特征；响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并执行所述语音指令。如此，预先记录声纹特征对应的终端标识，当收到该用户的语音指令时，不需要用户选择，可以自动根据该用户的声纹特征准确连接该用户使用的终端，提高音箱的使用效率，提升用户体验。

图1是根据一示例性实施例示出的一种音箱控制方法的流程图，如图1所示，音箱控制方法用于智能音箱中，包括以下步骤101-104：

在步骤101中，接收语音指令。

在步骤102中，提取所述语音指令中语音的第一声纹特征。

在步骤103中，比对所述第一声纹特征与预存在声纹库中的声纹特征。

在步骤104中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并执行所述语音指令。

这里，人的发声具有特定性和稳定性，每个人的声纹同指纹一样具有身份识别(认定个人)的作用。用户可以先在智能音箱中进行注册，预先录入用户对应的语音，由智能音箱按照预设的声纹特征提取算法或基于卷积神经网络的特征提取等提取这些用户的声纹特征，并将这些用户的声纹特征存储在声纹库中。用户在录入本用户在声纹特征时，用户可以打开本用户的终端的蓝牙功能或wifi功能，使得智能音箱可以搜索到该用户的终端标识，智能音箱可以显示提示信息，提示用户从搜索到的终端标识中选择本用户的终端标识，用户选择好本用户的终端标识后，智能音箱可以预先存储该用户的声纹特征与终端标识的对应关系。

如此，智能音箱在接收用户输入的语音指令时，就可以按照相同的声纹特征提取算法或基于相同的卷积神经网络提取该语音指令中语音的第一声纹特征，然后，一一比对所述第一声纹特征与预存在声纹库中的各声纹特征，按照预设的相似度计算方法计算第一声纹特征与预存在声纹库中的各声纹特征之间的相似度，如果预存在声纹库中的第二声纹特征与所述第一声纹特征的相似度超过预设阈值如97％等，则表明该第一声纹特征的用户与该第二声纹特征的用户为同一用户，此时，智能音箱就确定所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，智能音箱可以响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，查找预存的声纹特征与终端标识的对应关系，查到该第二声纹特征对应的终端标识，该第二声纹特征对应的终端标识就是该第一声纹特征的用户的终端的标识，此时，智能音箱就可以与该第二声纹特征对应的终端标识所标识的终端，即第一声纹特征的用户的终端，也即语音指令的输入用户的终端，建立无线连接如蓝牙连接或wifi连接等。

这里，智能音箱与该语音指令的输入用户的终端建立无线连接后，就可以通过所述无线连接与终端之间进行数据传输，接收终端发送的指令或数据等。当然，该智能音箱还需要执行所述语音指令。该语音指令的执行可能需要与终端传输数据后执行，也可以不需要与终端传输数据后执行，在此不做限制。

在一种可选的实施方式中，如所述语音指令为用于指示播放音频的指令时，智能音箱可以先判断要执行该语音指令需要连接终端，在确定执行该语音指令需要连接终端时，才执行步骤102，如接收到的语音指令为“播放歌曲xxx”，而该智能音箱中未存储歌曲xxx的音频数据，该智能音箱需要与终端如手机等连接来获取该音频数据才能执行该语音指令，此时，智能音箱可以执行步骤102至104，在与终端建立无线连接后，智能音箱可以通过该无线连接向该终端转发该指示智能音箱播放音频的语音指令，终端接收到该语音指令后，会从终端存储器内获取该要播放音频的音频数据或者从互联网中获取该要播放音频的音频数据，然后，终端可以通过该无线连接，将该要播放音频的音频数据发送给智能音箱，智能音箱接收到该音频数据后可以播放该音频数据。仍以语音指令为“播放歌曲xxx”为例，该智能音箱就可以通过该无线连接从终端获取到歌曲xxx的音频数据，进而执行该语音指令，播放该歌曲xxx。

本实施例可以在接收到语音指令时，提取所述语音指令中语音的第一声纹特征；比对所述第一声纹特征与预存在声纹库中的声纹特征；响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并执行所述语音指令。如此，预先记录声纹特征对应的终端标识，当收到该用户的语音指令时，不需要用户选择，可以自动根据声纹特征确定该用户使用的终端并进行连接以执行语音指令，提高音箱的使用效率，提升用户体验。

在一种可能的实施方式中，上述音箱控制方法中的在步骤103可以实现为以下步骤a1。

在步骤a1中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描并建立无线连接。

这里，智能音箱在确定所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征时，可以直接查找预存的声纹特征与终端标识的对应关系，确定该第二声纹特征对应的终端标识。若该智能音箱具有蓝牙功能，则智能音箱可以进行蓝牙扫描，直接扫描该第二声纹特征对应的终端标识所标识的终端如终端a，如果该终端a的蓝牙功能已被打开，则智能音箱就可以扫描到该终端a，智能音箱就可以主动与该终端a建立蓝牙连接。当然，该智能音箱也可能具有wifi(无线保真)功能，智能音箱可以直接对该第二声纹特征对应的终端标识所标识的终端进行wifi扫描，进而在扫描到该终端时，与该终端建立wifi连接。当然，该智能音箱还可能具有其他无线通信功能(例如：紫蜂zigbee等)，与终端建立其他类型的无线连接，在此不再一一例举。

这里需要说明的是，用户在使用该智能音箱时，为了使该智能音箱与用户的终端连接，用户会打开终端的蓝牙功能或wifi功能等无线通信功能，方便智能音箱扫描到该用户的终端。

在一种可能的实施方式中，上述音箱控制方法还可以包括以下步骤a2，上述的步骤103可以实现为以下步骤a3。

在步骤a2中，执行终端扫描操作，确定能够进行连接的终端的终端标识。

在步骤a3中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；从扫描到的终端标识中确定与所述第二声纹特征对应的终端标识；响应于扫描到的终端标识中存在与所述第二声纹特征对应的终端标识，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接。

这里，终端在进行步骤103之前可以先执行终端扫描操作，扫描得到智能音箱周围能够进行连接的终端的终端标识，示例的，若该智能音箱可以具有蓝牙功能，智能音箱可以进行蓝牙扫描，得到周围能够连接的终端标识，如此，该智能音箱周围打开蓝牙功能的终端都会被扫描到，智能音箱可以获取这些扫描到的终端标识。这里需要说明的是，用户在使用该智能音箱时，为了使该智能音箱与用户的终端连接，用户会打开终端的蓝牙功能或wifi功能等无线通信功能，方便智能音箱扫描到该用户的终端。

这样，智能音箱在确定所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征时，可以直接查找预存的声纹特征与终端标识的对应关系，确定该第二声纹特征对应的终端标识，然后，智能音箱可以从扫描到的终端标识中确定与所述第二声纹特征对应的终端标识，若所述扫描到的终端标识中存在与所述第二声纹特征对应的终端标识，表明该第二声纹特征对应的终端标识所标识的终端的无线连接功能已打开，可以被扫描到，该第二声纹特征对应的终端标识所标识的终端是可以被无线连接的，此时，智能音箱就可以与所述第二声纹特征对应的终端标识所标识的终端建立无线连接。

在一种可能的实施方式中，在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，上述音箱控制方法还包括以下步骤b1至b3。

在步骤b1中，输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接。

在步骤b2中，获取提供的所述第一声纹特征对应的终端标识。

在步骤b3中，与所述提供的终端标识所标识的终端建立无线连接。

这里，用户在使用该智能音箱时，为了使该智能音箱与用户的终端连接，通常都会打开终端的蓝牙功能或wifi功能等无线通信功能，方便智能音箱扫描到该用户的终端。

这里，在所述声纹库中的任一声纹特征与所述第一声纹特征的相似度均不超过预设阈值内时，表明在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，此时可能该第一声纹特征的用户并没有在智能音箱内注册，该智能音箱中没有存储该第一声纹特征的用户的终端的终端标识。此时，为了使智能音箱与用户的终端连接，执行该语音指令，智能音箱可以执行终端扫描操作，获取能够进行连接的终端的终端标识，显示第一提示信息，该第一提示信息为能够进行连接的终端的终端标识的列表，用户看到该第一提示信息后就可以从这些扫描到的终端标识中选择出用户的终端的终端标识，如此智能音箱就可以获取用户提供的所述第一声纹特征对应的终端标识，进而与所述提供的终端标识所标识的终端建立无线连接。

这里，在所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征的情况下，智能音箱进行步骤a1，直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描，但扫描不到该第二声纹特征对应的终端标识所标识的终端时；或者，智能音箱进行步骤a3时，扫描到的终端标识中没有与所述第二声纹特征对应的终端标识时，表明第二声纹特征的用户注册至智能音箱中的终端标识对应的终端不在智能音箱周围或未被用户使用而不能打开无线连接功能被连接，此时，智能音箱也可以输出第一提示信息，该第一提示信息也可以是智能音箱扫描到的能够进行连接的终端的终端标识的列表，用户看到该第一提示信息后就可以从这些扫描到的终端标识中选择出用户的终端的终端标识，如此智能音箱就可以获取用户提供的所述第一声纹特征对应的终端标识，进而与所述提供的终端标识所标识的终端建立无线连接。

这里，智能音箱上设置有显示屏时，智能音箱可以在显示屏上显示第一提示信息，如显示一提示框，该提示框内显示能够进行连接的终端的终端标识及其对应的选项框，以及“确定”按键，用户点击一可连接的终端标识的选项框进行选择，并点击“确定”按键，如此，智能音箱就可以获取用户选择的所述第一声纹特征对应的终端标识。或者该智能音箱可以输出语音“请从以下终端标识对应的序号中选择一序号：1、终端标识1，2、终端标识2，……”用户若向选择终端标识1为第一声纹特征对应的终端标识，则说“1”，智能音箱获取到语音“1”后，就获取到第一声纹特征对应的第一终端标识为终端标识1。当然，智能音箱还可以通过其他方式输出第一提示信息，用户也可以通过其他方式输入选择的第一声纹特征对应的终端标识终端标识，在此不一一例举。

这里，智能音箱得到该第一声纹特征对应的终端标识后，可以与所述第一声纹特征对应的终端标识所标识的终端建立无线连接，并通过所述无线连接，执行所述语音指令。

这里需要说明的是，若用户忘记给使用的终端打开无线连接功能，使得智能音箱扫描不到该第二声纹特征对应的终端标识所标识的终端时，用户在看到该第一提示信息后，可以手动打开该终端的无线连接功能，此时智能音箱就可以执行步骤104，连接该第二声纹特征对应的终端标识所标识的终端。

本实施例可以在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，获取所述第一声纹特征对应的终端标识；与所述提供的终端标识所标识的终端建立无线连接，进而通过所述无线连接，执行所述语音指令，适用于未注册的用户或注册的终端不能连接等多种情况，使用范围更广。

在一种可能的实施方式中，上述音箱控制方法还包括以下步骤c1和c2。

在步骤c1中，将所述第一声纹特征存储至所述声纹库中。

在步骤c2中，对应存储确定的所述第一声纹特征对应的终端标识。

这里，在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，表明该第一声纹特征的用户并没有在智能音箱内注册，此时，智能音箱可以将该第一声纹特征存储至所述声纹库中，同时对应存储所述第一声纹特征对应的终端标识，完成该第一声纹特征的用户的注册。

这里需要说明的是，在所述声纹库中存在所述第二声纹特征与所述第一声纹特征匹配，表明该第一声纹特征的用户已经在智能音箱内注册，该智能音箱可以不将该第一声纹特征存储至所述声纹库中，避免该智能音箱中存储过多的声纹特征，只需要存储第一声纹特征对应的终端标识存储为该第二声纹特征对应的终端标识，此时，该第二声纹特征可能对应多个终端标识。

这里，智能音箱将该第一声纹特征存储至所述声纹库中，并存储所述第一声纹特征对应的终端标识后，可以便于智能音箱在后续的声纹比对中根据该第一声纹特征识别出该第一声纹特征对应的终端标识，以便于该第一声纹特征的用户后续使用智能音箱。

本实施例可以响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，，将所述第一声纹特征存储至所述声纹库中；存储所述第一声纹特征对应的终端标识，以便于该第一声纹特征的用户在后续使用该智能音箱。

在一种可能的实施方式中，上述音箱控制方法还包括以下步骤d1至d3

在步骤d1中，响应于所述第二声纹特征对应至少两个终端标识，输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接。

在步骤d2中，获取选择的终端标识。

在步骤d3中，与所选择的终端标识所标识的终端建立无线连接。

这里，在预存的所述第二声纹特征对应至少两个第二终端标识时，表明该第一声纹特征的用户在智能音箱内注册有至少两个终端标识，此时，智能音箱可以输出第二提示信息，提示从所述至少两个终端标识中选择一个终端标识进行连接，用户在发现该第二提示信息后，可以从该至少两个终端标识选择当前可连接的终端的终端标识。需要说明的是，该第二提示信息的输出方式可以参考上述实施例中第一提示信息的输出方式，用户选择终端标识的方式也可以参考上述实施例，在此不再赘述。

这里，智能音箱得到用户选择的终端标识后，可以与所述用户选择的终端标识所标识的终端建立无线连接，并通过所述无线连接，执行所述语音指令。

本实施例可以在预存的所述第二声纹特征对应至少两个第二终端标识时，输出第二提示信息，所述第二提示信息用于提示从所述至少两个第二终端标识中选择一个终端标识进行连接；获取选择的终端标识；与所选择的终端标识所标识的终端建立无线连接；适用于一个用户注册有多个终端的情况，使用范围更广。

在一种可能的实施方式中，所述语音指令用于指示进行音频播放，且并未指定具体播放内容；上述音箱控制方法的步骤103中的执行所述语音指令还可以实现为以下步骤e1。

在步骤e1中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

这里，该智能音箱中可以存储有各用户对应的音频播放列表，该音频播放列表可以是用户通过与智能音箱连接的终端输入设置的，也可以是智能音箱记录的该用户的历史播放列表。智能音箱在记录各用户对应的音频播放列表时，可以通过记录该用户的声纹特征与用户对应的音频播放列表之间的对应关系来区分各用户的音频播放列表。

这里，用户在使用该智能音箱时，可能只指示该智能音箱进行音频播放，且并未指定具体播放内容，如用户指示输入语音指令“播放音乐”，该语音指令指示该智能音箱进行音频播放，但是并未指定具体播放内容，此时，智能音箱可以进行步骤102和103，在确定所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征时，可以响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，在智能音箱中存储有该音频播放列表中的内容时，可以直接进行播放，在智能音箱中未存储该音频播放列表中的内容时，可以与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，并通过该无线连接从连接的终端内获取该音频播放列表中的内容进行播放。

本实施例可以在语音指令指示进行音频播放，但未指定具体播放内容的情况下，自动根据该语音指令的用户的声纹特征确定音频播放列表进行播放，提高音箱的使用效率，提升用户体验。

下面通过几个实施例详细介绍实现过程。

图2是根据一示例性实施例示出的一种音箱控制方法的流程图，如图2所示，该音箱控制方法可以由智能音箱等设备实现，包括步骤201-210。

在步骤201中，接收语音指令；所述语音指令用于指示进行音频播放，且并未指定具体播放内容。

在步骤202中，提取所述语音指令中语音的第一声纹特征。

在步骤203中，比对所述第一声纹特征与预存在声纹库中的声纹特征。

在步骤204中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识。

在步骤205中，直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描并建立无线连接。

在步骤206中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

在步骤207中，响应于所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接。

在步骤208中，获取提供的所述第一声纹特征对应的终端标识。

在步骤209中，与所述提供的终端标识所标识的终端建立无线连接。

在步骤210中，将所述第一声纹特征存储至所述声纹库中；并对应存储确定的所述第一声纹特征对应的终端标识。

图3是根据一示例性实施例示出的一种音箱控制方法的流程图，如图3所示，该音箱控制方法可以由智能音箱等设备实现，包括步骤301-308。

在步骤301中，接收语音指令；

在步骤302中，执行终端扫描操作，确定能够进行连接的终端的终端标识；

在步骤303中，提取所述语音指令中语音的第一声纹特征；

在步骤304中，比对所述第一声纹特征与预存在声纹库中的声纹特征；

在步骤305中，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；

在步骤306中，响应于所述第二声纹特征对应至少两个终端标识，输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

在步骤307中，从扫描到的终端标识中确定选择的终端标识；

在步骤308中，响应于扫描到的终端标识中存在选择的终端标识，与所选择的终端标识所标识的终端建立无线连接。

下述为本公开装置实施例，可以用于执行本公开方法实施例。

图4是根据一示例性实施例示出的一种音箱控制装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4所示，该音箱控制装置包括：

接收模块401，用于接收语音指令；

提取模块402，用于提取所述语音指令中语音的第一声纹特征；

比对模块403，用于比对所述第一声纹特征与预存在声纹库中的声纹特征；

响应模块404，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接；

执行模块405，用于执行所述语音指令。

作为一种可能的实施例，图5是根据一示例性实施例示出的一种音箱控制装置的框图，如图5所示，上述公开的音箱控制装置还可以把响应模块404配置成包括第一响应子模块4041和扫描子模块4042，其中：

第一响应子模块4041，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；

扫描子模块4042，用于直接对与所述第二声纹特征对应的终端标识所标识的终端进行扫描并建立无线连接。

作为一种可能的实施例，图6是根据一示例性实施例示出的一种音箱控制装置的框图，如图6所示，上述公开的音箱控制装置还可以被配置成包括扫描模块406，还可以把响应模块404配置成包括第二响应子模块4043、确定子模块4044和第三响应子模块4045；其中：

扫描模块406，用于执行终端扫描操作，确定能够进行连接的终端的终端标识；

第二响应子模块4043，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的终端标识；

确定子模块4044，用于从扫描到的终端标识中确定与所述第二声纹特征对应的终端标识；

第三响应子模块4045，用于响应于扫描到的终端标识中存在与所述第二声纹特征对应的终端标识，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接。

作为一种可能的实施例，图7是根据一示例性实施例示出的一种音箱控制装置的框图，如图7所示，上述公开的音箱控制装置还可以被配置成包括第一输出模块407、第一获取模块408和第一建立模块409，其中：

第一输出模块407，用于响应于所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接；

第一获取模块408，用于获取提供的所述第一声纹特征对应的终端标识；

第一建立模块409，用于与所述提供的终端标识所标识的终端建立无线连接。

作为一种可能的实施例，图8是根据一示例性实施例示出的一种音箱控制装置的框图，如图8所示，上述公开的音箱控制装置还可以被配置成包括存储模块410，其中：

存储模块410，用于响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，将所述第一声纹特征存储至所述声纹库中，并对应存储确定的所述第一声纹特征对应的终端标识。

作为一种可能的实施例，图9是根据一示例性实施例示出的一种音箱控制装置的框图，如图9所示，上述公开的音箱控制装置还可以被配置成包括第二输出模块411、第二获取模块412和第二建立模块413，其中：

第二输出模块411，用于响应于所述第二声纹特征对应至少两个终端标识，输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

第二获取模块412，用于获取选择的终端标识；

第二建立模块413，用于与所述选择的终端标识对应的终端建立无线连接。

作为一种可能的实施例，所述语音指令用于指示进行音频播放，且并未指定具体播放内容；图10是根据一示例性实施例示出的一种音箱控制装置的框图，如图10所示，上述公开的音箱控制装置还可以把执行模块405配置成包括第四响应子模块4051，其中：

第四响应子模块4051，用于响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图11是根据一示例性实施例示出的一种音箱控制装置的框图，该装置适用于音箱设备。该装置1100可以包括以下一个或多个组件：处理组件1101，存储器1102，电源组件1103，多媒体组件1104，音频组件1105，输入/输出(i/o)接口1106，传感器组件1107，以及通信组件1108。

处理组件1101通常控制装置1100的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件1101可以包括一个或多个处理器1120来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1101可以包括一个或多个模块，便于处理组件1101和其他组件之间的交互。例如，处理组件1101可以包括多媒体模块，以方便多媒体组件1104和处理组件1101之间的交互。

存储器1102被配置为存储各种类型的数据以支持在装置1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1103为装置1100的各种组件提供电力。电源组件1103可以包括电源管理系统，一个或多个电源，及其他与为装置1100生成、管理和分配电力相关联的组件。

多媒体组件1104包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1104包括一个前置摄像头和/或后置摄像头。当装置1100处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1105被配置为输出和/或输入音频信号。例如，音频组件1105包括一个麦克风(mic)，当装置1100处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1102或经由通信组件1108发送。在一些实施例中，音频组件1105还包括一个扬声器，用于输出音频信号。

i/o的接口1106为处理组件1101和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1107包括一个或多个传感器，用于为装置1100提供各个方面的状态评估。例如，传感器组件1107可以检测到装置1100的打开/关闭状态，组件的相对定位，例如所述组件为装置1100的显示器和小键盘，传感器组件1107还可以检测装置1100或装置1100一个组件的位置改变，用户与装置1100接触的存在或不存在，装置1100方位或加速/减速和装置1100的温度变化。传感器组件1107可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1107还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1107还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1108被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信组件1108经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件1108还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带(uwb)技术，蓝牙(bt)技术和其他技术来实现。

在示例性实施例中，装置1100可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1102，上述指令可由装置1100的处理器1120执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置1100的处理器执行时，使得装置1100能够执行上述音箱控制方法，所述方法包括：

接收语音指令；提取所述语音指令中语音的第一声纹特征；

比对所述第一声纹特征与预存在声纹库中的声纹特征；

或者

在所述接收到语音指令之后，还包括：

执行终端扫描操作，确定能够进行连接的终端的终端标识；

则，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，包括：

输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接；

获取提供的所述第一声纹特征对应的终端标识；

与所述提供的终端标识所标识的终端建立无线连接。

在一个实施例中，响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，所述方法还包括：

将所述第一声纹特征存储至所述声纹库中；并

对应存储确定的所述第一声纹特征对应的终端标识。

在一个实施例中，响应于所述第二声纹特征对应至少两个终端标识，所述方法还包括：

输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

获取选择的终端标识；并

与所选择的终端标识所标识的终端建立无线连接。

在一个实施例中，所述语音指令用于指示进行音频播放，且并未指定具体播放内容；

执行所述语音指令，包括：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

本实施例还提供了一种音箱控制装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

接收语音指令；提取所述语音指令中语音的第一声纹特征；

比对所述第一声纹特征与预存在声纹库中的声纹特征；

在一个实施例中，上述处理器还可以被配置为：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，包括：

或者

在所述接收到语音指令之后，还包括：

执行终端扫描操作，确定能够进行连接的终端的终端标识；

则，响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，包括：

在一个实施例中，上述处理器还可以被配置为：

响应于所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，或者无法与所述第二声纹特征对应的终端标识所标识的终端建立无线连接，所述方法还包括：

输出第一提示信息，所述第一提示信息用于提示用户提供终端进行连接；

获取提供的所述第一声纹特征对应的终端标识；

与所述提供的终端标识所标识的终端建立无线连接。

在一个实施例中，上述处理器还可以被配置为：

响应于在所述声纹库中不存在所述第二声纹特征与所述第一声纹特征匹配，所述方法还包括：

将所述第一声纹特征存储至所述声纹库中；并

对应存储确定的所述第一声纹特征对应的终端标识。

在一个实施例中，上述处理器还可以被配置为：

响应于所述第二声纹特征对应至少两个终端标识，所述方法还包括：

输出第二提示信息，所述第二提示信息用于提示从所述至少两个终端标识中选择一个终端标识进行连接；

获取选择的终端标识；并

与所选择的终端标识所标识的终端建立无线连接。

在一个实施例中，上述处理器还可以被配置为：

所述语音指令用于指示进行音频播放，且并未指定具体播放内容；

执行所述语音指令，包括：

响应于所述声纹库中存在与所述第一声纹特征匹配的第二声纹特征，确定与所述第二声纹特征对应的音频播放列表，并进行播放。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：钱庄
技术所有人：北京小米移动软件有限公司
我是此专利的发明人

上一篇：一种堆芯仪表套管组件切割系统的制作方法
上一篇：可调式组合切割轮的制作方法