一种具备语音中断功能的智能故事机及其实现方法与流程

文档序号：17074716发布日期：2019-03-08 23:37阅读：401来源：国知局

本发明涉及故事机技术领域，特别是一种具备语音中断功能的智能故事机及其实现方法。

背景技术：

随着科技的发展，对婴幼儿群体开发的智能产品愈来愈多。目前故事机与早教机产品为市场上针对婴幼儿产品的主流，但现有的故事机或早教机产品目前均适用于近距离使用，即语音拾取都是通过近场完成的，对于使用用户为小朋友时，这种近场的使用模式对于小朋友来说有很多限制，同时会影响儿童的使用感和体验感。

技术实现要素：

为了解决上述问题，发明人构思将故事机赋予远场控制和语音中断唤醒的功能，从而可以使小朋友们在不同的距离内使用故事机，扩大使用范围，从而可以解放孩子的天性，增强用户的使用感和体验感。

根据本发明的第一个方面，提供了一种具备语音中断功能的智能故事机，包括：

麦克风，用于拾取用户语音；

喇叭；

声音处理模块，用于分别从麦克风和喇叭获取用户语音和喇叭参考音频进行处理后，输出数字信号至数据处理模块

数据处理模块，用于对声音处理模块输出的数字信号进行处理，根据处理结果对用户语音进行响应。

根据本发明的第二个方面，提供了一种具备语音中断功能的智能故事机的实现方法，包括如下步骤：

将故事机的喇叭连接至声音处理模块，形成回声消除电路；

通过故事机的喇叭进行远场拾音，获取用户语音；

在获取到用户语音时，通过回声消除电路获取喇叭参考音频；

对用户语音和喇叭参考音频进行噪声消除处理，得到用户语音指令；

对用户语音指令进行语音响应处理。

根据本发明提供的装置和方法，通过对麦克风和喇叭的声音进行处理，以通过麦克风拾取用户声音，通过喇叭拾取喇叭参考音，通过声音和数据处理模块实现对喇叭回声的消除，实现了远场拾音和中断处理，可以实现扩大故事机的使用范围，不仅仅局限于近场使用，对于婴幼儿这一群里可以使该故事机的使用方法更灵活，符合婴幼儿的天性，大大的增强了其体验感和使用感。

附图说明

图1为本发明一实施方式的具备语音中断功能的智能故事机的原理框图；

图2为本发明又一实施方式的具备语音中断功能的智能故事机的原理框图；

图3为本发明一实施方式的具备语音中断功能的智能故事机的实现方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“装置”、“系统”等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地系统、分布式系统中另一元件交互的，和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

下面结合附图对本发明作进一步详细的说明。

图1示意性地显示了根据本发明的一种实施方式的具备语音中断功能的智能故事机原理框图。如图1所示，

该具备语音中断功能的智能故事机包括：麦克风2、喇叭1、声音处理模块3、数据处理模块4和通信模块5。

麦克风2用于拾取用户语音，在本实施例实现为单mic。声音处理模块3用于分别从麦克风2和喇叭1获取用户语音和喇叭参考音频进行处理后，输出数字信号至数据处理模块4。其中，声音处理模块3包括aec回声消除电路301和数字转换单元302。

aec回声消除电路301与喇叭1连接，用于获取喇叭1参考音频，该参考音频为故事机自身发出的语音例如正在播放小故事，现有的故事机由于在远场拾音时无法解决自身播放音频的音频干扰问题，因而都是通过近场拾音，即无法实现语音中断唤醒功能，因而应用场景受限。该aec回声消除电路301的实现方式可以参照现有技术实现。

数字转换单元302分别与麦克风2和aec回声消除电路301连接，用于对用户语音和参考音频信号进行转换，即通过模数转换为数字信号，该模数转换的方式可以参照现有技术实现，并将该数字信号输出至数据处理模块4。

在具体实现中，声音处理模块3可以实现为dsp处理芯片，数字转换单元302可以通过数字转换芯片实现，而回声消除电路301则通过在喇叭和声音处理模块3之间接入电线，形成aec回声消除电路实现。

数据处理模块4用于对声音处理模块3输出的数字信号进行处理，根据处理结果对用户语音进行响应，该模块可以实现为故事机设备中的mcu芯片。其中，数据处理模块4包括噪音消除单元401、语音识别单元402和响应处理单元403。

噪音消除单元401用于根据获取到的已经转换的用户语音的数字信号和喇叭参考音频的数字信号，进行回声消除处理，该回声消除处理的方式可以参照现有技术实现。优选地，实现会对两者进行减法运算，即将用户语音的数字信号减去喇叭参考音频的数字信号，以得到去噪后的相对纯净的数字信号。

语音识别单元402用于对回声消除后的数字信号进行语音识别，生成识别文本经由通信模块5输出至云端。该语音识别单元402进行语音识别的方式可以参照现有技术的语音识别实现。通过通信模块5实现与云端的数据交互，示例性地，实现为通过无线连接的方式与云端进行通信，如wifi模块等。

云端在对接收到的识别文本进行分析，解析出其对应的响应指令返还给故事机，该响应指令用于触发故事机对应的操作。响应处理单元403用于接收云端返回的响应指令进行语音交互响应，根据该响应指令的内容调用故事机对应的接口执行相应的操作。

根据本实施例的方法可以实现根据麦克风进行远场的交流，并且能够基于噪声消除的方式，实现基于远场的语音中断功能，可以扩大故事机的使用范围，不仅仅局限于近场使用，对于婴幼儿这一群里可以使该故事机的使用方法更灵活，符合婴幼儿的天性，大大的增强了其体验感和使用感。

图2示意性地显示了根据本发明另一实施方式的具备语音中断功能的智能故事机原理框图。如图2所示，

该具备语音中断功能的智能故事机还包括调度模块6，并且数据处理模块4还包括唤醒引擎单元404、

该唤醒引擎单元404用于进行唤醒词注册，并接收噪音消除单元401输出的数字信号进行唤醒识别，输出唤醒识别结果，该唤醒识别的方式可以参照现有技术实现，将获取的数字信号输出至唤醒引擎进行唤醒处理。并且，响应处理单元403还用于根据唤醒识别结果和注册的唤醒词生成响应指令，该响应指令为执行语音交互功能的指令，其与故事机对应的功能接口相适配，根据该响应指令可以调用故事机的响应接口进行响应操作，以对用户语音进行响应处理，以此可以达到语音唤醒的功能。

调度模块6用于根据通信模块5的网络状态，获取的方式可以调用相应的网络接口获取该网络状态，并且在网络状态为未连接时，将噪音消除单元401处理后的数字信号输出至唤醒引擎单元404；在网络状态为连通时，将噪音消除单元401处理后的数字信号输出至语音识别单元403，再由语音识别单元403进行相应的处理。

根据本实施例的装置，使得该故事机不仅可以在有网络连接的情况下使用，还可以在断网的情况下使用，增加了使用的灵活性。并且对于加入的唤醒引擎单元，可以提高故事机的唤醒率，增加语音交互的功能，大大的提高了用户的体验感。

图3示意性地显示了根据本发明一实施方式的具备语音中断功能的智能故事机的实现方法流程图，如图3所示，本实施例包括如下步骤：

步骤s301：将故事机的喇叭连接至声音处理模块，形成回声消除电路。该回应消除电路的搭建可以参照现有技术实现。

步骤s302：通过故事机的麦克风进行远场拾音，获取用户语音。用户发出声音时，由故事机的单mic麦克风进行远场拾音。

步骤s303：在获取到用户语音时，通过回声消除电路获取喇叭参考音频，为故事机喇叭正在播放的音频信息，获取的方式为通过形成的回声消除电路读取，可以参照现有技术实现。

步骤s304：对用户语音和喇叭参考音频进行噪声消除处理，得到用户语音指令。具体实现为：将用户语音指令和喇叭参考音频均通过模数转换。转换为数字信号，并对转换后的数字信号进行数字信号的减法运算得到用户语音指令。该具体的实现方式可以参照现有技术实现。

步骤s305：对用户语音指令进行语音响应处理。具体实现为：首先，在获取到用户语音指令时，进行网络状态的判断，根据网络状态进行对用户语音指令进行语音响应处理。

在判断网络状态为连接时，在故事机中对用户语音指令进行语音识别，得到文本信息输出至云端语音平台，根据云端语音平台返回的操作指令，进行响应处理，该操作指令可以触发故事机对应的功能接口执行对应的响应操作。语音识别的方式可以参照现有技术实现。

在判断网络状态为未连接时，在故事机中通过唤醒引擎对用户语音指令进行唤醒识别，并根据唤醒识别结果进行响应处理，该响应处理的方式可以与网络连接状态的响应处理的实现方式相同。优选地，在故事机本地为通过语音唤醒的方式，进行语音交互响应，提高响应速度，且不会加重故事机的处理负担。

根据本实施例的方法可以实现使故事机在有网和无网的状态下都可以进行远场的语音交互，实现了扩大故事机的使用范围效果，不仅仅局限于近场使用，对于婴幼儿这一群里可以使该故事机的使用方法更灵活，符合婴幼儿的天性，大大的增强了其体验感和使用感。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程栋梁;雷雄国;雷玉雄;刘寒英;黄海艳;曾勋;陈庆安
技术所有人：深圳市慧声信息科技有限公司
我是此专利的发明人

上一篇：烹饪器具的制作方法
上一篇：一种铝底不锈钢压力锅及加工工艺的制作方法