一种机器人的制作方法

文档序号：12475875阅读：250来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明属于人机交互技术领域，尤其涉及一种机器人。

背景技术：

随着人工智能行业的发展，语音交互已经比较普遍。在现有的机器人中通常使用语音识别技术进行语音交互。然而由于语音识别技术的性能受到许多因素的影响，如不同说话人的发音方式、说话方式、环境噪音、传输信道衰落等，导致现有机器人对语音的识别度较低。

故，有必要提出一种新的技术方案，以解决上述技术问题。

技术实现要素：

鉴于此，本发明实施例提供一种机器人，以解决现有机器人对语音的识别度较低的问题。

本发明实施例的第一方面，提供一种机器人，所述机器人包括：

处理器、麦克风阵列、语音处理模块以及运动控制模块，其中，所述麦克风阵列包括至少两个麦克风；

所述处理器分别与所述语音处理模块以及运动控制模块连接；

所述麦克风阵列与所述语音处理模块连接；

所述麦克风阵列，用于采集语音信息，并将所述语音信息发送给所述语音处理模块；

所述语音处理模块，用于对接收到的所述语音信息进行处理，并将处理后的所述语音信息发送给所述处理器；

所述处理器，用于在接收到所述语音信息后，根据所述语音信息控制所述运动控制模块执行相应的操作。

本发明实施例与现有技术相比存在的有益效果是：本发明实施例通过采用包括处理器、麦克风阵列、语音处理模块以及运动控制模块的机器人，使得麦克风阵列采集语音信息，并将所述语音信息发送给所述语音处理模块，所述语音处理模块对接收到的所述语音信息进行处理，并将处理后的所述语音信息发送给所述处理器，所述处理器在接收到所述语音信息后，根据所述语音信息控制所述运动控制模块执行相应的操作，进而提高了机器人的抗干扰能力和稳定性，解决了现有机器人对语音的识别度较低的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种机器人的组成示意图；

图2是本发明实施例二提供的一种机器人的组成示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例一：

图1示出了本发明实施例一提供的一种机器人100的组成示意图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

如图1所示，本发明实施例所提供的机器人100包括：处理器11、麦克风阵列12、语音处理模块13以及运动控制模块14。

其中，所述麦克风阵列12包括至少两个麦克风。

所述处理器11分别与所述语音处理模块13以及运动控制模块14连接。

所述麦克风阵列12与所述语音处理模块13连接。

所述麦克风阵列12，用于采集语音信息，并将所述语音信息发送给所述语音处理模块13；

所述语音处理模块13，用于对接收到的所述语音信息进行处理，并将处理后的所述语音信息发送给所述处理器11；

所述处理器11，用于在接收到所述语音信息后，根据所述语音信息控制所述运动控制模块14执行相应的操作。

可选的，所述处理器11可以为单片机芯片或ARM芯片。所述运动控制模块14可以包括电机驱动电路和电机，电机驱动电路按照控制逻辑为电机提供相应的驱动功率，使所述运动控制模块执行相应的移动。

具体地，所述麦克风阵列12具有对远场噪声很强的抑制作用，在噪声环境中具有良好的信号采集性。所述麦克风阵列12是指按照一定距离排列放置的一组麦克风，通过声波抵达阵列中每个麦克风之间的微小时差的相互作用，麦克风阵列可以得到比单个麦克风更好的指向性。通过对麦克风信号的综合处理，麦克风阵列12可以组合成所要求的强指向性麦克风，形成被称为波束的指向特性。麦克风阵列12的波束可以经由电路或程序处理，使其指向声源方向加强音频采集效果，只接收说话人的声音的同时抑制环境中的噪声与干扰。较佳的，所述麦克风阵列12以两个麦克风线性布局，麦克风间距为80mm。

在本发明实施例中，通过所述麦克风阵列12实现语音信号的采集，通过语音处理模块13完成噪声的滤除与语音信号的增强，降低了使用距离、环境噪声等限制因素对语音信号的影响，从而实现了较好的语音识别。

可选的，所述处理器11还用于：

在接收到唤醒指令后，向用户发送准备就绪的提示信息，并在接收到控制指令后，根据所述控制指令控制所述机器人执行相应的操作。

在本发明实施例中，可以通过多麦克风阵列接收较远距离(3m内)用户的语音指令信息，交互设计以及技术应用上提高了家庭环境娱乐的方便性以及可靠性。例如用户可以问机器人说“小Q小Q”(可用户自定义的唤醒命令)，本系统回复“主人，我在呢”，用户说“北京明天天气怎么样”，然后查询数据库中的内容，按实际天气情况作出答复；甚至您可以在机器人播放音乐的嘈杂环境下说“小Q小Q”，本系统回复“主人，我在呢”，你说“音响声音调小点”，然后机器人系统自动控制音量变小。之所以能够在较远距离和嘈杂环境中进行语音控制并且具有较好的识别率，取决于本机器人采用的多麦克风阵列特性以及较好交互方式。

本发明实施例通过专有的唤醒系统来实现交互行为的发起，极大程度提高了语音交互系统的对环境依赖性，交互逻辑简单可靠，消除用户适应语音识别节奏的难度，同时避免了识别时连续监听对系统资源的要求和功耗负担。本发明实施例结合技术现状和家庭娱乐交互环境与特点全局考虑，设计出一种低成本且适合嵌入式系统机器人使用的一套语音交互系统，提高了系统的抗干扰能力以及稳定性，降低了使用难度。

可选的，所述语音处理模块13包括：

信号调理模块131以及麦克风阵列数据处理模块132；

所述信号调理模块131分别与所述麦克风阵列12和所述麦克风阵列数据处理模块132连接；

所述信号调理模块131，用于在接收到所述麦克风阵列12发送的语音信息后，对所述语音信息进行第一处理，并将第一处理后的语音信号发送给所述麦克风阵列数据处理模块132；

所述麦克风阵列数据处理模块132，用于在接收到所述第一处理后的语音信息后，对所述第一处理后的语音信息进行第二处理，并将第二处理后的语音信息发送给所述处理器11，以使得所述处理器11在接收到该语音信息后，根据该语音信息控制所述运动控制模块14执行相应的操作。

在本发明实施例中，所述信号调理模块131包括滤波电路和放大电路。所述麦克风阵列数据处理模块132包括多通道AD采集、DSP数据处理和硬件中断触发。

具体的，多个麦克风形成的阵列采集语音信号然后对每路信号进行硬件滤波以及信号放大，该信号通过麦克风阵列数据处理模块132，在其中包含AD采集转换成数字信号，然后进行算法数据处理，最终的信号传送到处理器11。

可选的，所述麦克风阵列数据处理模块132的型号可以为科大讯飞XFM10211模块。该模块利用麦克风阵列的空域滤波特性，通过对唤醒人的角度定位，形成定向拾音波束，并对波束以外的噪声进行抑制，以保证较高的录音质量。主要有以下特性：2麦克风线性麦克风阵列；语音唤醒；回声消除；语音打断；去混响。其中，所述2麦克风线性麦克风阵列支持远场拾音，所述远场拾音是指运用远场识别和降噪技术，使拾音距离达到3米。所述语音唤醒是指用户通过说出关键词(默认关键词是“打开语音助手”)，可以将模块从休眠状态唤醒，唤醒后，会有WAKE_UP标志位输出。所述回声消除是指在播放和录音同时进行的场景，模块通过回声消除技术，可以将扬声器的声音屏蔽，只接收用户的声音。语音打断：在设备播音时，仍然可以唤醒，实现打断效果。

本发明实施例通过采用麦克风阵列采集语音信息，提高了机器人的抗干扰能力和稳定性，解决了现有机器人对语音的识别度较低的问题。

实施例二：

图2示出了本发明实施例二提供的一种机器人的组成示意图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

如图2所示，本发明实施例所示的机器人200与图1所示的机器人100的区别之处在于本发明实施例所示的机器人200还包括：状态采集模块21、指示模块22、无线模块23、存储模块24、电源系统25以及数据库服务器26。

其中，所述状态采集模块21与所述处理器11连接；

所述状态采集模块21用于采集所述机器人的状态信息，并将所述状态信息发送给所述处理器11。

具体地，所述状态采集模块21可以对所述机器人所在环境和一些交互信息进行检测，加强其智能性，增强其可玩性，为其娱乐功能服务。

可选的，所述状态采集模块21包括：

温度传感器211、光敏传感器212、加速度传感器213、红外传感器214以及触摸传感器215。

所述温度传感器211，可以采用电阻式温度传感器，只要将其布置在电路板位置能表征室温的地方，室温的变化就会转换成电阻变换，再通过A/D采集便可解析出温度。

所述光敏传感器212，通过光敏器件(如光敏三极管、光敏二极管、光敏电阻等)获得光线的变化数据，获得光敏信号，经处理后发送至处理器11。

所述加速度传感器213，通过加速度芯片获得返回x、y、z三轴的加速度数值,经处理后发送至处理器11。

所述红外传感器214，可以采用红外线反射式传感器，利用红外线反射的原理，根据反射的强度来判定前方是否有障碍。在距离适中时测量精度很高。由于使用的是红外线，所以抗干扰能力很强,能有效避免机器人在运动过程中碰撞问题。

所述触摸传感器215，通过触摸片获得触摸电容的变化数据，进而获得触摸信息，经处理后发送至处理器11,可以作为和用户互动的一种方式。

可选的，所述指示模块22与所述处理器11连接；

所述指示模块22，用于在接收到所述处理器11发送的指示信息后，根据所述指示信息执行相应的操作。

在本发明实施例中，所述指示模块22包括LED驱动电路和LED。LED驱动电路以及LED可以实现灯光效果以及一些指示功能。

可选的，所述机器人200还可以包括提示模块，所述提示模块包括音频放大电路和喇叭。音频放大电路为喇叭提供相应的功率，使其将音频信号还原出声音，来完成提示音，语音回复等相应响应效果。

可选的，所述无线模块23与所述处理器11连接。

在本发明实施例中，所述无线模块23包括但不限于wifi模块，用于实现互联网的连接以及与数据库服务器之间的通讯。

可选的，所述存储模块24与所述处理器11连接。

在本发明实施例中，所述存储模块24可以与所述处理器11组合形成主系统，所述存储模块24可以用于存储所述处理器11接收到的数据或者处理的数据。其中，所述存储模块24可以为双倍速率同步动态随机存储器(Double Data Rate，DDR)、FLASH存储器、TF卡、SD卡等。

可选的，所述电源系统25与所述处理器11连接；

所述电源系统25，用于向所述处理器11供电。

具体地，所述电源系统25可以包括电池(如锂电池)、充电电路和电压转换电路，以实现对整个机器人系统的供电。所述充电电路对电池进行充电，并提供充电电流限制、充电电压管控、充电指示等相关的控制与指示。电压转换电路，通过电压转换电路，如LDO转换电路，DC-DC转换电路、PMU电源管理电路等，将输入的电压转换成内部器件所需要的电压。锂电池可以采用常规的聚合物锂电池。

可选的，所述数据库服务器26与所述处理器11连接；

所述数据库服务器26，用于在接收到所述处理器11发送的请求信息时，根据该请求信息向所述处理器11反馈相应的应答信息。

其中，所述数据库服务器26作为机器人系统的后台资源存储着相应的内容数据。包括但不限于问答数据库服务器，音频曲目数据库服务器，知识百科数据库服务器等。

问答数据库服务器可以根据用户需要自行搭建，设计并编辑一定数量的对答数据内容，最终再通过用户使用逐步积累。音频曲目数据库服务器可以采用与第三方音乐平台(如QQ音乐，百度音乐等)进行合作，通过中转机器人系统可以访问授权的第三方音乐平台的音乐内容。知识百科数据库服务器也可以采用和已有成熟的数据库来合作，使其提供丰富、优质的数据资源，如搜狗百科数据库。基于以上服务器方案可以给用户提供丰富的娱乐内容资源。

在本发明实施例的一种实际应用场景中，以用户发起一次功能操作为例，首先用户语音发起唤醒指令，如“小Q小Q”，系统的语音侦听系统进行采集解析，判断是否唤醒指令，如果是，置位中断引脚，硬件中断启动交互系统，准备就绪后给出语音提示。同时根据唤醒指令的波束信息解析出发指令所处的位置，并启动控制指令的侦听。当用户收到准备就绪提示时发出控制语音指令，如“唱一首刘德华的歌”，机器人通过多麦克风阵列采集到语音信息，进行增强与背景音滤除后，处理器进行语音识别，然后指令解析并转换成控制信号通过运动控制模块、指示模块、提示模块等完成相关的执行响应。本条指令“唱一首刘德华的歌”，系统会从数据库中分类出刘德华的歌曲依次播放。机器人也可以通过触摸、光敏等传感器完成一些交互，如用户触摸或靠近，系统会通过传感器检测，启动交互软件，进行指令解析，最终进行执行反馈。例如，用靠近机器人，机器人开口“主人，我看到你了，陪我玩会吧”，增加了机器人的主动交互，提升智能性和趣味性。

所述领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即所述装置的内部结构划分成不同的功能模块，上述功能模块既可以采用硬件的形式实现，也可以采用软件的形式实现。另外，各功能模块的具体名称也只是为了便于相互区别，并不用于限制本申请的保护范围。

综上所述，本发明实施例通过采用麦克风阵列采集语音信息，提高了机器人的抗干扰能力和稳定性，解决了现有机器人对语音的识别度较低的问题。

本领域普通技术人员还可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以在存储于一计算机可读取存储介质中，所述的存储介质，包括ROM/RAM、磁盘、光盘等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高向阳;程俊;郭海光
技术所有人：深圳先进技术研究院
我是此专利的发明人