调节音量的方法和装置与流程

文档序号：15938239发布日期：2018-11-14 02:44阅读：307来源：国知局

本公开涉及计算机技术领域，特别涉及调节音量的方法和装置。

背景技术

随着计算机技术和网络技术的发展，智能音箱逐渐进入人们的生活中。在使用智能音箱的过程中，通常需要控制智能音箱的输出音量。

相关技术中，智能音箱从待机状态进入工作状态时，一般是获取存储的上一次智能音箱的输出音量，作为当前的输出音量。

由于用户当前所处的环境和上一次的环境有可能不一样，还使用上一次的输出音量，有可能导致输出音量与环境不匹配。例如，用户当前所处的环境比较安静，上一次的环境比较嘈杂，智能音箱的输出音量一般比较大，而安静的环境所需的输出音量一般比较小，还使用比较大的输出音量，会导致输出音量与环境不匹配。

技术实现要素：

为了克服相关技术中存在的问题，本公开提供了调节音量的方法和装置。技术方案如下：

根据本公开实施例的第一方面，提供了一种调节音量的方法，所述方法包括：

接收用户输入的语音信号；

根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值；

根据确定出的调节值，对预设的初始音量进行调整，得到第一音量；

根据所述第一音量，控制本设备的音频输出。

可选的，所述根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值，包括：

确定所述语音信号的平均振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述平均振幅所属的振幅范围对应的调节值。

可选的，所述根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值，包括：

确定所述语音信号的最大振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述最大振幅所属的振幅范围对应的调节值。

可选的，所述方法还包括：

将所述语音信号对应的调节值存储为默认调节值；

当所述语音信号对应的调节值的存储时长达到预设阈值时，删除所述默认调节值。

可选的，所述根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值，包括：

如果本设备中未存储有默认调节值，则根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值，其中，所述默认调节值为上一次确定出的调节值；

所述方法还包括：

如果所述本设备中存储有默认调节值，则根据所述默认调节值，对所述预设的初始音量进行调整，得到第二音量；

根据所述第二音量，调节本设备的输出音量。

根据本公开实施例的第二方面，提供了一种调节音量的装置，所述装置包括：

接收模块，用于接收用户输入的语音信号；

确定模块，用于根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值；

调整模块，用于根据确定出的调节值，对预设的初始音量进行调整，得到第一音量；

控制模块，用于根据所述第一音量，控制本设备的音频输出。

可选的，所述确定模块，用于：

确定所述语音信号的平均振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述平均振幅所属的振幅范围对应的调节值。

可选的，所述确定模块，用于：

确定所述语音信号的最大振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述最大振幅所属的振幅范围对应的调节值。

可选的，所述装置还包括：

存储模块，用于将所述语音信号对应的调节值存储为默认调节值；

删除模块，用于当所述语音信号对应的调节值的存储时长达到预设阈值时，删除所述默认调节值。

可选的，所述确定模块，用于：

所述调整模块，还用于：

如果所述本设备中存储有默认调节值，则根据所述默认调节值，对所述预设的初始音量进行调整，得到第二音量；

所述控制模块，还用于根据所述第二音量，调节本设备的输出音量。

根据本公开实施例的第三方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述第一方面所述的调节音量的方法。

根据本公开实施例的第四方面，提供了一种智能设备，所述智能设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述第一方面所述的调节音量的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：

本公开实施例中，智能音箱输出音频时，使用的音量是第一音量，第一音量与用户输入的语音信号的振幅相关，振幅与说话声音的大小相关，而且用户说话声音的大小与所处环境有关，所以基于语音信号的振幅，确定出的第一音量是与环境相匹配。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。在附图中：

图1是根据一示例性实施例示出的一种调节音量的场景示意图；

图2是根据一示例性实施例示出的一种调节音量的方法流程示意图；

图3是根据一示例性实施例示出的一种调节音量的装置的结构示意图；

图4是根据一示例性实施例示出的一种调节音量的装置的结构示意图；

图5是根据一示例性实施例示出的一种智能设备的结构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开一示例性实施例提供了一种控制音量的方法，该方法可以由智能设备实现。该智能设备可以是智能音箱等，该智能音箱中可以设置有处理器、存储器、收发器等，处理器可以用于对控制音量的过程进行处理，存储器可以用于存储下述处理过程中需要的数据以及产生的数据，收发器可以用于接收以及发送消息。智能音箱中还可以包括麦克风、屏幕等，麦克风可以用于接收以及播放语音信号。本公开实施例以智能设备为智能音箱为例，进行方案的详细说明。

进行实施前，首先介绍智能音箱与用户使用的手机进行绑定的过程：

用户可以将智能音箱开启，智能音箱则会广播蓝牙信号，然后可以在手机中安装智能音箱的管理应用程序，然后操作开启管理应用程序并登录该管理应用程序，手机会显示管理应用程序的主界面，主界面中显示有添加设备的选项，用户可以点击添加设备的选项，终端则会检测到添加设备的选项的点击指令，接收智能音箱广播的蓝牙信号。然后将识别到的智能音箱的标识显示在界面中，用户可以点击该标识，终端则会显示无线网络接入界面，用户可以输出无线网络的名称和密码，使智能音箱接入无线网络。这样，就将智能音箱与手机绑定完成，并且使智能音箱接入网络。

本公开实施例的应用场景为：每次用户在使用智能音箱前，都需要将智能音箱从待机状态唤醒，具体过程是，智能音箱处于待机状态时，智能音箱可以检测环境中人的语音信号，如果检测到预设的语音信号，则会从待机状态进入工作状态，并且发出预设的答复语音信号，用户可以再说出进行操作的语音信号，对智能音箱进行控制。例如，如图1所示，用户可以说“小a同学”，智能音箱检测到“小a同学”的语音信号，智能音箱可以发出“我在”的语音信号，用户就可以说“播放奔跑歌曲”，智能音箱可以搜索“奔跑”的歌曲进行播放。

如图2所示，该方法的处理流程可以包括如下的步骤：

在步骤201中，接收用户输入的语音信号。

在实施中，用户想要使用智能音箱，可以说预设的话语，智能音箱可以检测到用户说预设的话语的语音信号。例如，用户可以说“小a同学”，智能音箱检测到“小a同学”的语音信号。

另外，智能音箱在接收到用户输入的语音信号后，有可能还同时接收到其他人的语音信号，智能音箱可以对一起接收到的其它语音信号进行过滤，如可以使用声纹识别的方式进行过滤，智能音箱可以对输入的语音信号进行声纹识别，将识别到不是用户的声纹的语音信号过滤(智能音箱中预先存储有用户的声纹)，得到的语音信号就是用户输入的语音信号。

在步骤202中，根据语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定语音信号对应的调节值。

其中，振幅范围与调节值的对应关系可以由技术人员预设，并且存储至智能音箱中，在该对应关系中，每个振幅范围对应一个调节值。

在实施中，智能音箱接收到用户输入的语音信号后，可以对该语音信号进行识别，如果识别到的语音信号与预先存储的用于唤醒自己的语音信号相同，则可以确定语音信号的振幅，并且获取预先存储的振幅范围与调节值的对应关系，然后根据语音信号的振幅，在该对应关系中查找到语音信号对应的调节值。

需要说明的是，在智能音箱的初始音量一般是中间音量(智能音量的音量为1～10，初始音量为5)时，在初始音量的基础上进行调整，一般振幅范围的边界值越大，调节值的绝对值越大，这是由于用户说话声音小，说明环境比较安静，肯定希望智能音箱播放预设答复语音信号所使用的音量也比较小，所以需要将智能音量的输出音量大幅度的减小，所以音量变化比较大。用户说话声音大，说明环境比较嘈杂，肯定希望智能音箱播放预设答复语音信号所使用的音量也比较大，所以需要将智能音量的输出音量大幅度的增加，所以音量变化比较大。

可选的，确定语音信号对应的调节值的方法有多种，以下给出两种可行的方式：

方式一，确定语音信号的平均振幅；根据预先存储的振幅范围与调节值的对应关系，确定平均振幅所属的振幅范围对应的调节值。

在实施中，智能音箱可以获取到语音信号的振幅，然后计算语音信号的平均振幅，并获取预先存储的振幅范围与调节值的对应关系，智能音箱可以在该对应关系中，确定出平均振幅所属的振幅范围，然后确定出该振幅范围对应的调节值。

方式二，确定语音信号的最大振幅；根据预先存储的振幅范围与调节值的对应关系，确定最大振幅所属的振幅范围对应的调节值。

在实施中，智能音箱可以获取到语音信号的振幅，然后确定其中的最大振幅，并获取预先存储的振幅范围与调节值的对应关系，智能音箱可以在该对应关系中，确定出最大振幅所属的振幅范围，然后确定出该振幅范围对应的调节值。

可选的，如果本设备中未存储有默认调节值，则根据语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定语音信号对应的调节值。

其中，默认调节值为上一次确定出的调节值。

在实施中，在每次确定进入待机状态时，如果确定出语音信号对应的调节值，可以将该调节值存储为默认调节值，不过该默认调节值有一定的生效时长，如果超过生效时长，默认调节值则会被删除。

在接收到用户输入的语音信号后，如果确定该语音信号为预设的用于唤醒的语音信号，智能音箱可以查看是否存储有默认调节值，如果没有存储默认调节值，可以根据语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定语音信号对应的调节值。

另外，智能音箱中存储有默认调节值时的处理可以如下：

如果本设备中存储有默认调节值，则根据默认调节值，对预设的初始音量进行调整，得到第二音量；根据第二音量，调节本设备的输出音量。

在实施中，在接收到用户输入的语音信号后，如果确定该语音信号为预设的用于唤醒的语音信号，智能音箱可以查看是否存储有默认调节值，如果存储有默认调节值，智能音箱可以直接根据该默认调节值对预设的初始音量进行调整，得到第二音量(基于默认调节值是系数和调节数值，也可以使用两种方式确定第二音量，与前面的描述相同，此处不再赘述)，然后使用该第二音量播放预设的答复语音信号。这样，可以缩短确定调节值的时长。

在步骤203中，根据确定出的调节值，对预设的初始音量进行调整，得到第一音量。

其中，预设的初始音量可以由技术人员预设，并且存储至智能音箱中，

在实施中，每次智能音箱进行待机状态时，智能音箱可以将自身的音量调整为预设的初始音量。例如，将音量分为10个值(1～10)，预设的初始音量为5，在进入待机状态时，用户使用智能音箱在播放歌曲，输出音量为7，智能音箱在进入待机状态时，可以将音量调整为5。

智能音箱在确定出调节值后，可以根据该调节值，对预设的初始音量进行调整，得到第一音量。

可选的，确定第一音量的方式有多种，以下给出两种可行的方式：

方式一：调节值是调节数值，将预设的初始音量与调节值，进行叠加，得到第一音量。

在实施中，确定出的调节值是调节数值，与初始音量是一个单位，智能音箱可以将预设的初始音量与调节值叠加，得到第一音量。例如，初始音量为5，调节值为-2，得到的第一音量为3。

方式二：调节值是调节系数，将预设的初始音量与调节值，进行相乘，得到第一音量。

在实施中，确定出的调节值是调节系数，智能音箱可以将预设的初始音量与调节值相乘，得到第一音量。例如，初始音量为5，调节值为0.6，得到的第一音量为3。

在步骤204中，根据第一音量，控制本设备的音频输出。

在实施中，智能音箱得到第一音量后，智能音箱可以使用该第一音量播放预设的答复语音信号。

这样，由于第一音量是使用用户输入的语音信号的振幅确定的，所以确定出的第一音量与用户说话声音的大小相匹配，而且由于用户说话声音的大小与当前所处的环境有关系(一般环境安静，说话声音小，环境嘈杂，说话声音大)，所以用户通过改变自己的说话声音的大小，就可以控制智能音箱的输出音量。

可选的，本公开实施例中，智能音箱还可以存储默认调节值，相应的处理可以如下：

将平均振幅所属的振幅范围对应的调节值存储为默认调节值；当平均振幅所属的振幅范围对应的调节值的存储时长达到预设阈值时，删除默认调节值。

其中，预设阈值可以由技术人员预设，并且存储至智能音箱中，如2个小时等。

在实施中，智能音箱在确定出平均值所属的振幅范围对应的调节值后，可以将该调节值存储为默认调节值，并且记录当前的时间点，当检测到该调节值对应的存储时长达到预设阈值，可以删除该默认调节值。

这样，如果两次使用智能音箱的间隔时间比较短，用户所处的环境变化的可能性比较低，所以在第二次唤醒智能音箱，可以直接获取到调节值，而不需要确定调节值，从而可以快速的唤醒智能音箱。

基于相同的技术构思，本公开另一实施例提供了一种控制音量的装置，如图3所示，该装置包括：

接收模块310，用于接收用户输入的语音信号；

确定模块320，用于根据所述语音信号的振幅、预先存储的振幅范围与调节值的对应关系，确定所述语音信号对应的调节值；

调整模块330，用于根据确定出的调节值，对预设的初始音量进行调整，得到第一音量；

控制模块340，用于根据所述第一音量，控制本设备的音频输出。

可选的，所述确定模块320，用于：

确定所述语音信号的平均振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述平均振幅所属的振幅范围对应的调节值。

可选的，所述确定模块320，用于：

确定所述语音信号的最大振幅；

根据预先存储的振幅范围与调节值的对应关系，确定所述最大振幅所属的振幅范围对应的调节值。

可选的，如图4所示，所述装置还包括：

存储模块350，用于将所述语音信号对应的调节值存储为默认调节值；

删除模块360，用于当所述语音信号对应的调节值的存储时长达到预设阈值时，删除所述默认调节值。

可选的，所述确定模块320，用于：

所述调整模块330，还用于：

如果所述本设备中存储有默认调节值，则根据所述默认调节值，对所述预设的初始音量进行调整，得到第二音量；

所述控制模块340，还用于根据所述第二音量，调节本设备的输出音量。

需要说明的是：上述实施例提供的调节音量的装置在调节音量时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的调节音量的装置与调节音量的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本公开再一示例性实施例提供了一种智能设备的结构示意图。该智能设备可以是智能音箱等。

参照图5，智能设备500可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(i/o)的接口512，传感器组件514，以及通信组件516。

处理组件502通常控制智能设备500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件502可以包括一个或多个处理器520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理部件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在智能设备500的操作。这些数据的示例包括用于在智能设备500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。

电力组件506为智能设备500的各种组件提供电力。电力组件506可以包括电源管理系统，一个或多个电源，及其他与为音频输出设备500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述智能设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当智能设备500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(mic)，当音频输出设备500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。

i/o接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为智能设备500提供各个方面的状态评估。例如，传感器组件514可以检测到智能设备500的打开/关闭状态，组件的相对定位，例如所述组件为智能设备500的显示器和小键盘，传感器组件514还可以检测智能设备500或智能设备500一个组件的位置改变，用户与智能设备500接触的存在或不存在，智能设备500方位或加速/减速和智能设备500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于智能设备500和其他设备之间有线或无线方式的通信。智能设备500可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信部件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件516还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带(uwb)技术，蓝牙(bt)技术和其他技术来实现。

在示例性实施例中，智能设备500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由智能设备500的处理器520执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由智能设备的处理器执行时，使得智能设备能够执行上述调节音量的方法。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李潇
技术所有人：北京小米智能科技有限公司
我是此专利的发明人