一种玩具的基于语音识别的自学习方法和自学习装置的制造方法

文档序号：9933941阅读：297来源：国知局

一种玩具的基于语音识别的自学习方法和自学习装置的制造方法
【技术领域】
[0001]本发明涉及智能玩具领域，尤其涉及一种玩具的基于语音识别的自学习方法和自学习装置。
【背景技术】
[0002]随着电子技术和人工智能的不断发展，玩具作为一种面向特定用户群体的电子设备，因为其良好的互动性受到越来越多人的青睐，例如对玩具说“唱歌”，玩具在识别出“P昌歌”指令后，会播放预存的歌曲。
[0003]但是现有的玩具只能当做一种根据预设的剧本进行互动的玩具，其互动方式的多样性受制于玩具生产时输入的剧本个数，如果预置的剧本个数为3个，那么玩具只能对3种语音内容进行响应;如果预置的剧本个数为10个，那么玩具只能对10种语音内容进行响应。那么当儿童对玩具进行一段时间的体验后，因为互动内容没有更新，儿童玩具的互动性会逐步下降，丧失玩具功能。并且如果通过预置的方式设置互动内容，需要为每一个玩具预存互动内容;如果要面向不同的语种区域的客户群体，还需要准备多种不同语种的互动内容。

【发明内容】

[0004]本发明提供了一种玩具的基于语音识别的自学习方法和自学习装置，其通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据，在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存，实现了玩具自身对语音的学习，避免了预存语音对玩具的语种的限制，避免了玩具制作过程中针对不同语种区域预存不同音频数据。
[0005]为实现上述设计，本发明采用以下技术方案:
[0006]—方面采用一种玩具的基于语音识别的自学习方法，包括:
[0007]输出语音采集提示，开启语音采集设备；
[0008]所述语音采集设备采集第一音频数据，提取所述第一音频数据的特征数据；
[0009]所述语音采集设备采集与所述第一音频数据匹配的第二音频数据；
[0010]将所述第一音频数据和第二音频数据关联保存。
[0011 ]其中，所述将所述第一音频数据和第二音频数据关联保存之后，还包括:
[0012]当采集到外部音频数据且从所述外部音频数据中提取到的特征数据与所述第一音频数据的特征数据的相似度达到预设的阈值时，输出第二音频数据。
[0013]其中，所述语音采集设备采集第一音频数据，提取所述第一音频数据的特征数据，具体为:
[0014]所述语音采集设备采集重复一至三次的第一语音产生的一至三份第一音频数据，根据所述一至三份第一音频数据提取特征数据。
[0015]其中，所述输出语音采集提示，开启语音采集设备之前，还包括:
[0016]接收学习行为执行指令。
[0017]其中，所述语音采集设备为单个麦克风。
[0018]另一方面采用一种玩具的基于语音识别的自学习装置，包括:
[0019]状态初始化模块，用于输出语音采集提示，开启语音采集设备；
[0020]第一采集模块，用于所述语音采集设备采集第一音频数据，提取所述第一音频数据的特征数据；
[0021]第二采集模块，用于所述语音采集设备采集与所述第一音频数据匹配的第二音频数据；
[0022]数据保存模块，用于将所述第一音频数据和第二音频数据关联保存。
[0023]其中，还包括:
[0024]声音响应模块，用于当采集到外部音频数据且从所述外部音频数据中提取到的特征数据与所述第一音频数据的特征数据的相似度达到预设的阈值时，输出第二音频数据。
[0025]其中，所述第一采集模块，具体用于:
[0026]所述语音采集设备采集重复一至三次的第一语音产生的一至三份第一音频数据，根据所述一至三份第一音频数据提取特征数据。
[0027]其中，还包括:
[0028]状态激活模块，用于接收学习行为执行指令。
[0029]其中，所述语音采集设备为单个麦克风。
[0030]本发明的有益效果为:通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据，在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存，实现了玩具自身对语音的学习，避免了预存语音对玩具的语种的限制，避免了玩具制作过程中针对不同语种区域预存不同音频数据。
【附图说明】
[0031]为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据本发明实施例的内容和这些附图获得其他的附图。
[0032]图1是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习方法的第一实施例的方法流程图。
[0033]图2是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习方法的第二实施例的方法流程图。
[0034]图3是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习装置的第一实施例的结构方框图。
[0035]图4是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习装置的第二实施例的结构方框图。
【具体实施方式】
[0036]为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚，下面将结合附图对本发明实施例的技术方案作进一步的详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0037]请参考图1，其是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习方法的第一实施例的方法流程图。如图所示，该自学习方法，包括:
[0038]步骤SlOl:输出语音采集提示，开启语音采集设备。
[0039]当玩具进行自学习时，会首先输出语音采集提示，一般而言，语音采集提示为语音提示，直接通过语音提醒用户可以说话;或者，也可以采用视觉提示，例如玩具上的灯进行闪烁或进入常亮状态，提醒用户玩具已经准备好采集语音。玩具在输出语音提示时，玩具同时将语音采集设备开启，以备采集语音。语音采集设备例如拾音器和麦克风。拾音器集成了先进的噪声处理、回声处理以及长距传输驱动电路，以高保真的音质忠实地记录和还原现场。麦克风(简称为话筒)，单纯是一种将声音转换成电子信号的换能器，通常是定向的低灵敏的，在很近的距离对准了发生才能起到想要的声音采集效果。
[0040]步骤S102:所述语音采集设备采集第一音频数据，提取所述第一音频数据的特征数据。
[0041]玩具的互动过程可以视为玩具与用户的互动过程，一般而言，互动由用户发起，由玩具进行响应，第一音频数据是用户发起互动时玩具是否进行响应的判断参照，也就是说第一音频数据用于激活互动过程。针对第一音频数据在整个互动过程中的重要作用，采集第一音频数据时需要提取第一音频数据的特征数据，在后续进行互动时，玩具需要提取外部发起互动的语音产生的音频数据与特征数据的相似性，进而判断是否响应互动。
[0042]步骤S103:所述语音采集设备采集与所述第一音频数据匹配的第二音频数据。
[0043]第二音频数据用于玩具互动时输出，即玩具判断需要对互动进行响应时，输出对应的第二音频数据。所以在整个过程中只需要对第二音频数据进行记录，无需对第二音频数据进行识别，整个方案中对第二音频数据的处理只包括采集、保存和读取，无需识别。
[0044]步骤S104:将所述第一音频数据和第二音频数据关联保存。
[0045]将第一音频数据和第二音频数据关联保存，当互动过程被某一第一音频数据激活时，输出关联的第二音频数据。
[0046]在本实施例中，描述的是一次自学习过程中的数据处理动作，每一个完整的自学习过程包括对第一音频数据和第二音频数据的处理。对于一个玩具而言，其互动内容的逐步丰富的过程是需要多个相互独立的自学习过程支撑的。从整个互动内容逐步丰富的过程而言，第一音频数据或第二音频数据并不是一条数据，而是一类数据，其中第一音频数据用于作为互动过程发起的参考，第二音频数据作为确认互动时对第一音频数据的响应。第一音频数据和第二音频数据关联保存。
[0047]综上所述，通过在输出提示后所述语音采集设备采集第一音频数据并提取音频数据的特征数据，在采集与第一音频数据匹配的第二音频数据后将第二音频数据和第一音频数据关联保存，实现了玩具自身对语音的学习，避免了预存语音对玩具的语种的限制，避免了玩具制作过程中针对不同语种区域预存不同音频数据。
[0048]请参考图2，其是本发明【具体实施方式】中提供的一种玩具的基于语音识别的自学习方法的第二实施例的方法流程图。如图所示，该自学习方法，包括:
[0049]步骤S201:接收学习行为执行指令。
[0050]玩具本身并不具备独立思维并操作自身的能力，学习行为执行指令作为一个操作指令，当玩具接收到这一指令时，开始后续动作，对音频数据进行处理。
[0051 ]步骤S202:输出语音采集提示，开启语音采集设备。
[0052]优选的，语音采集设备为单个麦克风。
[0053]拾音器和麦克风有各自的技术优势，在本实施例中的应用场景中，第一音频数据最好为内容单一的音

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙涛;
技术所有人：深圳市艾塔文化科技有限公司;
我是此专利的发明人

上一篇：吹箭筒玩具的触发机构的制作方法
上一篇：一种自驱动陀螺及基于该自驱动陀螺的子母陀螺的制作方法