自定位的智能音箱的制作方法

文档序号：13011367阅读：259来源：国知局

本发明主要涉及计算机技术领域，具体地说，涉及一种自定位的智能音箱。

背景技术：

随着智能音箱的普及，语音识别的效果越来越受到重视，麦克风拾音的效果与发声者的距离和环境噪声有很大关系，但是如果音箱摆放在离声反射物(例如，墙面或墙角)较近的位置，周围声反射物(例如，墙面或墙角)对声音的反射与说话者声音混合在一起造成拾音的干扰，同样对拾音效果影响很大，目前的定位方案利用多麦克风阵列定位声源，提高识别效果，但是忽略了对智能音箱自身的自定位。因此，存在周围声反射物对拾音效果的干扰。

技术实现要素：

有鉴于此，本公开提供了一种实现自定位且增大拾音效果的自定位的智能音箱。

本公开的一个方面提供了一种自定位的智能音箱，包括：两个或更多个喇叭，用于向各个方向发送一段不连续的声波；麦克风阵列，由一个或多个麦克风组成，所述一个或多个麦克风接收喇叭所发送的声波；控制单元，用于计算一个或多个麦克风接收到所述声波的时间，并根据计算结果确定智能音箱相对于声反射物的位置。

根据本公开的实施例，智能音箱中的控制单元根据所述智能音箱相对于声反射物的位置设置麦克风阵列对来自各个方向的声音的拾音权重。

根据本公开的实施例，所放送和所接收的声波的频率为大约20khz。

根据本公开的实施例，在智能音箱周围的声反射物包括墙面和/或墙角。

根据本公开的实施例，智能音箱的控制单元降低麦克风阵列对来自声反射物的方向上的声音的拾音权重。

根据本公开的实施例，智能音箱的喇叭具有适于较高声波频段的高频特性。

本公开的另一方面提供了一种用于对智能音箱进行自定位的方法，包括：利用智能音箱上的两个或更多个喇叭向各个方向发送一段不连续声波；利用智能音箱上的一个或多个麦克风接收喇叭所发送的声波；计算一个或多个麦克风接收到所述声波的时间，并根据计算结果确定智能音箱的位置。

根据本公开的实施例，用于对智能音箱进行自定位的方法还包括：根据所述智能音箱的位置设置一个或多个麦克风对来自各个方向的声音的拾音权重。

根据本公开的实施例，在用于对智能音箱进行自定位的方法中，所述声波经墙面/墙角反射后被所述一个或多个麦克风接收。

根据本公开的实施例，在用于对智能音箱进行自定位的方法中，所述智能音箱的位置是智能音箱相对于墙面/墙角的位置。

根据本公开的实施例，用于对智能音箱进行自定位的方法还包括：根据智能音箱相对于墙面/墙角的位置来降低一个或多个麦克风对来自墙面和/或墙角的方向上的声音的拾音权重。

根据本公开的实施例，在用于对智能音箱进行自定位的方法中，所述声波的频率为大约20khz。

附图说明

通过以下参照附图对本公开实施例的描述，本公开的上述以及其他目的、特征和优点将更为清楚，在附图中：

图1示出了根据本发明实施例的自定位智能音箱外观及其所处场景的示意图。

图2示出了根据本发明实施例的自定位智能音箱各个功能模块的示意图。

图3示出了根据本发明实施例的自定位智能音箱的喇叭频率响应曲线图。

图4示出了根据本发明实施例的自定位智能音箱的麦克风频率响应曲线图。

图5示出了根据本发明实施例的自定位智能音箱进行自定位的方法的流程图。

图6示出了根据本发明实施例的自定位智能音箱调整拾音权重的方法的流程图。

图7是示出了根据本发明实施例的自定位智能音箱的控制模块的电子设备700的框图

具体实施方式

以下对本发明的实施例做出说明，其中包括本发明实施例的各种细节以有助于理解，应当将它们认为仅仅是示例性的。因此，本领域的技术人员应当认识到，可对本文描述的实施例做出各种修改和改变，而不脱离本发明的范围和精神。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思，除非上下文另外明确指出。此外，在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

图1示出了根据本发明实施例的自定位智能音箱外观及其所处场景的示意图。如图1所示，自定位智能音箱包括箱体101、麦克风102和喇叭103。其中，箱体形状为部分圆锥体，麦克风102位于箱体102的上表面，且具有多个以形成麦克风阵列，例如，图1中示出了四个麦克风以形成麦克风阵列。本领域技术人员也容易想到，可以设置任意数量的麦克风。喇叭102位于箱体102的侧表面且面向不同的方向以向不同方向发送声波。喇叭的数量可以设置为两个或多个。

如图1所示，例如，将智能音箱放置于房间内，其各个喇叭面向不同的墙面或墙角。因此，例如，由各个喇叭发出的声波将分别经历不同的时间到达各自对应的墙面或墙角，并分别被反射回。经反射回的声波例如分别被设置在不同位置处的麦克风接收。由此，根据接收到声波的时间差异，可以确定智能音箱箱体相对于不同方向上的墙面或墙角的距离。在实际使用时也可以根据反射时间算出声波是经墙角还是单墙面反射回。同样，本领域技术人员可以想到，声波也可能被其它声反射物反射回，因此，也可以确定智能音箱箱体相对于不同方向上的其它声反射物的距离。

图2示出了根据本发明实施例的自定位智能音箱各个功能模块的示意图。自定位智能音箱包括喇叭模块，其由两个或多个喇叭231、232、……、23n组成。两个或多个喇叭231、232、……、23n被设置成面向不同的方向以向不同的方向发送声波。声波可以为普通声波，也可以为接近超声波的高频声波，其中，例如，接近超声波的高频声波的频率范围可以为16-20khz，或者优先为20khz左右。在这个频率范围的高频声波一般人耳无法听到。声波可以为连续声波，也可以为不连续声波。在发送不连续声波时，人耳将更难察觉。由于20khz左右的声波人耳基本听不见，所以发送高频声波时并不会给用户带来困扰。

图3示出了根据本发明实施例的自定位智能音箱的喇叭频率响应曲线图。如图3所示，喇叭在面向不同的方向时发送声波的不同频率响应，例如，在轴向上的声波的频率响应i，在30度方向上的声波的频率响应ii，在60度方向上的声波的频率响应iii。图3还同时示出了阻抗响应iiii。其中可以看出，喇叭的高频特性较好，没有衰减很严重，也没有造成高频声波音量很弱的现象。因此，在发送高频声波时，可以满足声音发送强度方面的要求，使得高频声波可以到达墙面/墙角并反射回以被麦克风接收。进一步地，为了增强喇叭的高频性能，在发送高频声波时，可以调整功放的高频增益，以增加高频声波的发送强度。

自定位智能音箱还包括麦克风模块，其由一个或多个麦克风221、222、……、22n组成。一个或多个麦克风221、222、……、22n形成麦克风阵列以接收来自不同方向上的声波。一个或多个麦克风221、222、……、22n接收来自不同方向的声波。所述声波可以是普通声波，也可以是高频声波。所述声波可以是连续声波，也可以是不连续声波。在声波为高频声波，尤其是为不连续高频声波的情况下，人耳基本听不见该声波。在接收不连续高频声波时，由于声波来自不同方向，且经过距离不同的声反射物反射，因此，对于同一时间发送的声波，各个声波的接收时间不同。

图4示出了根据本发明实施例的自定位智能音箱的麦克风频率响应曲线图。其中在灵敏度0db对应于1v/pa，1khz的情况。麦克风的灵敏度在0db左右，虽然20khz时衰减很多，但是仍能满足识别的需求，而且接入系统后也是可以调整麦克风的增益，即，可以调高麦克风的高频增益以增加定位效果，在完成定位后再恢复麦克风的增益。

自定位智能音箱还包括控制模块，所述控制模块控制喇叭模块在定位阶段发出不连续的高频声波，所述高频声波的频率范围为16-20khz，且优化为20khz左右。由于喇叭为两个或更多个且面向不同方向。因此，发送的高频声波不止一个且朝向不同方向传播。高频声波在不同方向上传播且经不同反射物(例如，墙面或墙角)反射回。所述控制模块控制麦克风在定位阶段接收反射回的高频声波，在音箱箱体的位置离不同的声反射物的距离不同的情况下，麦克风接收到高频声波的时间不同。利用该时间差，控制单元可以计算出自定位智能音箱相对于不同声反射物的距离以进行自我定位。进一步地，为了增加在后续的拾音阶段中的拾音效果，控制模块可以依据所计算的离不同反射物的距离(即，音箱的定位)来设置麦克风在不同方向上的拾音权重，以减小反射波对拾音效果造成的影响。其中，比如，当控制模块计算出自定位智能音箱的哪一面朝向墙体时，可以自动降低该方向的麦克风权重以减小该墙面反射波对拾音效果造成的影响，以达到最大拾音效果。

图5示出了根据本发明实施例的自定位智能音箱进行自定位的方法的流程图。所述方法包括以下步骤：

步骤501，利用智能音箱上的两个或更多个喇叭向各个方向发送一段不连续声波，所述声波例如是高频声波，且频率范围为16-20khz，优选为20khz；

步骤502，利用智能音箱上的一个或多个麦克风接收喇叭所发送的声波；所述声波来自不同方向，且是经反射物反射回的声波；

步骤503，计算一个或多个麦克风接收到所述声波的时间，并根据计算结果确定智能音箱的位置。具体地，针对某一方向上的反射物反射回的声波，计算麦克风阵列接收到的时间，接收最快的说明该方向是面向墙体的。

由此，可以定位智能音箱本身相对于周围反射物(例如，墙面或墙角)的位置。

在确定智能音箱相对于周围反射物的位置的情况下，可以设置麦克风阵列在相应方向上的拾音权重，由此，可以减小反射波对拾音的干扰。

具体地，图6示出了根据本发明实施例的自定位智能音箱调整拾音权重的方法的流程图。其完整地涵盖了整个方法流程。具体地，

在步骤601，两个或多个喇叭向各个方向发送一段不连续声波，以用于定位。用于定位的不连续声波为高频声波。

在步骤602，向不同方向传播的不连续声波分别被声反射物(例如，墙面或墙角)反射。由于声反射物离智能音箱的距离不一样，所以，同一时间发送的一段不连续声波在不同的时间点被反射回。

在步骤603，麦克风阵列接收反射回智能音箱的声波。由于声波的前向传播和反射后传播的距离不一样，所以，对于同一时间发送的不连续高频声波，麦克风阵列在不同的时间点接收到反射回的不连续高频声波。

在步骤604，控制模块计算声波返回的时间。具体地，针对同一时间向不同方向发送的不连续高频声波，计算麦克风阵列接收到来自不同方向的声波的时间。

在步骤605，利用发送和接收的时间及时间差来确定智能音箱的位置，尤其是，比如，智能音箱的哪一面朝墙。

在步骤606，根据所确定的智能音箱的位置，确定麦克风阵列在各个方向上的拾音权重，具体地在面朝墙的方向上，减小麦克风阵列的拾音权重，以减小在该方向上的反射波对后续进行的语音拾音的干扰。

图7是示出了根据本发明实施例的自定位智能音箱的控制模块的电子设备700的框图。电子设备700包括处理器706(例如，微处理器(cpu)、数字信号处理器(dsp)等)。处理器706可以是用于执行本文描述的控制单元的不同动作的单一处理单元或者是多个处理单元。电子设备700还可以包括用于从其他实体接收信号的输入单元702、以及用于向其他实体提供信号的输出单元704。输入单元702和输出单元704可以被布置为单一实体或者是分离的实体。

此外，电子设备700可以包括具有非易失性或易失性存储器形式的至少一个可读存储介质708，例如是电可擦除可编程只读存储器(eeprom)、闪存、和/或硬盘驱动器。可读存储介质710包括计算机程序710，该计算机程序710包括代码/计算机可读指令，其在由电子设备700中的处理器706执行时使得电子设备700可以执行例如上面结合图1至图7所描述的任一流程及其组合。

计算机程序710可被配置为具有例如计算机程序模块710a～710e(仅作为示例，可以更多或更少)架构的计算机程序代码。因此，装置700的计算机程序中的代码包括：模块710a，用于…。计算机程序中的代码还包括：模块710b，用于…。计算机程序中的代码还包括：模块710c，用于…，诸如此类。

尽管上面结合图7所公开的实施例中的代码手段被实现为计算机程序模块，其在处理器706中执行时使得控制模块的电子设备700执行上面结合图5至6所描述的动作，然而在备选实施例中，该代码手段中的至少一项可以至少被部分地实现为硬件电路。

以上方案仅是示出本发明构思的一个具体实现方案，本发明不限于上述实现方案。可以省略或跳过上述实现方案中的一部分处理，而不脱离本发明的精神和范围。

本发明不限于上述示例实施例，它可以在不脱离本公开的精神和范围的前提下，包括一个或多个其他部件或操作，或省略一个或多个其他部件或操作。

以上已经结合本发明的优选实施例示出了本发明，但是本领域的技术人员将会理解，在不脱离本发明的精神和范围的情况下，可以对本发明进行各种修改、替换和改变。因此，本发明不应由上述实施例来限定，而应由所附权利要求及其等价物来限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丛东升;毛占伟
技术所有人：北京灵隆科技有限公司
我是此专利的发明人

上一篇：一种电子装置外壳板材结构的制作方法
上一篇：一种多功能便捷式手拉音箱的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。