一种基于人机交互的学习型电动玩具控制方法与流程

文档序号：37917101发布日期：2024-05-10 23:56阅读：11来源：国知局

本技术涉及数据处理、机器学习领域，具体而言，涉及一种基于人机交互的学习型电动玩具控制方法。

背景技术：

1、随着科技的进步和人们生活水平的提高，电动玩具已经成为儿童娱乐和教育的重要组成部分。特别是学习型电动玩具，它们不仅提供了娱乐功能，还融入了教育元素，帮助儿童在玩耍中学习新知识、发展智力。然而，现有的学习型电动玩具在智能化和个性化方面仍有待提升。

2、传统的学习型电动玩具通常预设了固定的功能和模式，无法根据儿童的状态和兴趣变化进行动态调整。这导致玩具的娱乐性和教育性在一定程度上受到限制，无法满足儿童多样化的需求。此外，由于缺乏有效的学习机制，这些玩具无法从与儿童的互动中学习和改进，从而限制了其长期使用的价值。

3、因此，本领域技术人员一直在探索如何将更先进的机器学习和人工智能技术应用于学习型电动玩具中。通过引入这些技术，学习型电动玩具可以具备更强的自适应能力，能够根据儿童的行为和反馈进行智能调整，提供更个性化的娱乐和教育体验。同时，这些玩具还可以通过持续学习不断优化自身的功能和性能，从而延长使用价值，提高性价比。

4、在现有技术中，对用户反馈的采集分析通常是较为单一的，例如语音或图像，使得分析得到的用户状态可能不够准确，而采集多源信息，如何进行信息对齐也是需要克服的技术问题。

技术实现思路

1、本发明的目的在于提供一种基于人机交互的学习型电动玩具控制方法。

2、本技术实施例是这样实现的：第一方面，本技术实施例提供了一种基于人机交互的学习型电动玩具控制方法，所述方法包括：获取拟分析行为交互数据的行为表征数组以及拟分析语音交互数据的语音表征数组；所述拟分析行为交互数据为所述拟分析语音交互数据对应的匹配行为数据；依据所述行为表征数组确定所述语音表征数组中的核心语音表征数组；所述核心语音表征数组为在所述行为表征数组中具有牵涉语义表征的语音表征数组；依据所述行为表征数组和所述核心语音表征数组进行特征交互得到整合表征数组，将所述整合表征数组嵌入至预设特征域，得到整合嵌入表征数组；依据所述整合嵌入表征数组进行目标语音解析，得到目标语音标记集合；根据所述目标语音标记集合制定目标交互控制策略，以依据所述目标交互控制策略控制学习型电动玩具。

3、在一种实施方式中，所述依据所述行为表征数组确定所述语音表征数组中的核心语音表征数组，包括：依据所述行为表征数组和所述语音表征数组确定跨注意力影响系数；依据所述跨注意力影响系数对所述语音表征数组进行修正，得到核心语音表征数组；所述依据所述行为表征数组和所述核心语音表征数组进行特征交互得到整合表征数组，包括：依据所述行为表征数组确定内部注意力影响系数；依据所述内部注意力影响系数对所述行为表征数组进行修正，得到核心行为表征数组；对所述行为表征数组、所述核心语音表征数组和所述核心行为表征数组进行特征交互，得到整合表征数组。

4、在一种实施方式中，所述依据所述整合嵌入表征数组进行目标语音解析，得到目标语音标记集合，包括：依据所述整合嵌入表征数组，确定多个预设语音对象中的第一选定预设语音对象；所述第一选定预设语音对象为所述拟分析行为交互数据中的预设语音对象；确定所述第一选定预设语音对象在语音对象原型特征参数集合中对应的第一目标语音对象原型特征参数，所述语音对象原型特征参数集合包括所述多个预设语音对象中的每一预设语音对象的语音对象原型特征参数；依据所述第一目标语音对象原型特征参数对所述整合嵌入表征数组进行相似性度量，得到所述第一选定预设语音对象对应的目标整合嵌入表征数组；依据所述目标整合嵌入表征数组进行目标语音解析，得到所述第一选定预设语音对象对应的目标语音标记集合。

5、在一种实施方式中，所述依据所述整合嵌入表征数组，确定多个预设语音对象中的第一选定预设语音对象包括：在所述整合嵌入表征数组中抽取预设分类识别码对应位置的嵌入表征数组，得到分类嵌入表征数组，所述预设分类识别码为在生成所述行为表征数组是设置在所述拟分析行为交互数据首部的识别码；依据所述分类嵌入表征数组进行映射分类，得到分类信息，所述分类信息包括多个预设语音对象中的每一预设语音对象对应的支持系数，所述支持系数表征相应预设语音对象在所述拟分析行为交互数据中存在的置信水平；确定所述多个预设语音对象中，所述支持系数大于支持系数阈值的第一选定预设语音对象；所述依据所述第一目标语音对象原型特征参数对所述整合嵌入表征数组进行相似性度量，得到所述第一选定预设语音对象对应的目标整合嵌入表征数组包括：确定所述整合嵌入表征数组中各嵌入表征数组与所述第一目标语音对象原型特征参数之间的相似性度量结果；将所述相似性度量结果与所述嵌入表征数组相乘，将相乘结果与所述嵌入表征数组拼接以获得目标整合嵌入表征数组。

6、在一种实施方式中，所述方法依据语音标记网络执行，所述方法还包括所述语音标记网络的调试步骤，包括：获取调试学习样例库中的调试学习样例，所述调试学习样例包括行为交互样例数据和对应的语音交互样例数据，所述行为交互样例数据对应有对照语音标记集合；将所述调试学习样例加载到初始语音标记网络的嵌入映射组件，得到输出的样例整合嵌入表征数组；所述嵌入映射组件用于依据事前调试的行为编码模块确定所述行为交互样例数据对应的样例行为表征数组以及依据事前调试的语音处理网络确定所述语音交互样例数据对应的样例语音表征数组，依据所述样例行为表征数组确定所述样例语音表征数组中的样例核心语音表征数组，依据所述样例行为表征数组和所述样例核心语音表征数组进行特征交互得到样例整合表征数组，依据事前调试的整合神经网络对所述样例整合表征数组进行嵌入操作得到所述样例整合嵌入表征数组；将所述样例整合嵌入表征数组加载到所述初始语音标记网络的还原映射组件进行目标语音解析，得到多个推理语音标记集合的推理置信水平，所述多个推理语音标记集合包括所述对照语音标记集合；依据所述多个推理语音标记集合的推理置信水平，确定误差值；依据所述误差值分别对所述嵌入映射组件和所述还原映射组件中的可学习参变量进行优化，直至符合调试截止要求，得到所述语音标记网络。

7、在一种实施方式中，所述依据所述误差值分别对所述嵌入映射组件和所述还原映射组件中的可学习参变量进行优化，包括：依据所述误差值确定第一可学习参变量的第一学习率，所述第一可学习参变量为所述事前调试的语音处理网络中的可学习参变量；依据所述误差值确定第二可学习参变量的第二学习率，所述第二学习率大于所述第一学习率；所述第二可学习参变量包括所述嵌入映射组件中除所述第一可学习参变量外的可学习参变量和所述还原映射组件中的可学习参变量；依据所述第一学习率和第二学习率分别对相应可学习参变量进行优化。

8、在一种实施方式中，所述将所述样例整合嵌入表征数组加载到所述初始语音标记网络的还原映射组件进行目标语音解析，得到多个推理语音标记集合的推理置信水平包括：将所述样例整合嵌入表征数组加载到所述还原映射组件进行语音对象范围推理，得到语音对象范围推理结果；所述语音对象范围推理结果包括多个预设语音对象中的第二选定预设语音对象；确定所述第二选定预设语音对象，在语音对象原型特征参数集合中对应的第二目标语音对象原型特征参数；依据所述第二目标语音对象原型特征参数对所述样例整合嵌入表征数组进行相似性度量，得到所述第二选定预设语音对象对应的目标样例整合嵌入表征数组；将所述目标样例整合嵌入表征数组加载到所述还原映射组件的目标语音解析模块进行目标语音解析，得到所述第二选定预设语音对象对应的多个推理语音标记集合的推理置信水平。

9、在一种实施方式中，所述将所述样例整合嵌入表征数组加载到所述还原映射组件进行语音对象范围推理，得到语音对象范围推理结果包括：在所述样例整合嵌入表征数组中抽取预设分类识别码对应位置的嵌入表征数组，得到样例分类嵌入表征数组；所述预设分类识别码为在生成所述样例行为表征数组是设置在所述行为交互样例数据首部的识别码；将所述样例分类嵌入表征数组加载到所述还原映射组件的分类模块进行映射分类，得到推理分类信息；所述推理分类信息包括多个预设语音对象中的每一预设语音对象对应的推理支持系数，所述推理支持系数表征相应预设语音对象在所述行为交互样例数据中存在的置信水平；确定所述多个预设语音对象中所述推理支持系数大于支持系数阈值的第二选定预设语音对象，得到语音对象范围推理结果。

10、在一种实施方式中，所述依据所述多个推理语音标记集合的推理置信水平确定误差值，包括：基于第一误差确定函数，依据所述第二选定预设语音对象对应的多个推理语音标记集合的推理置信水平确定第一误差值；基于第二误差确定函数，依据所述推理分类信息和所述行为交互样例数据对应的对照分类先验信息确定第二误差值，所述对照分类先验信息用于指示所述多个预设语音对象中各预设语音对象是否在所述行为交互样例数据中存在；依据所述第一误差值和所述第二误差值，确定总误差值。

11、在一种实施方式中，所述基于第一误差确定函数，依据所述第二选定预设语音对象对应的多个推理语音标记集合的推理置信水平确定第一误差值，包括：在所述第二选定预设语音对象与所述对照分类先验信息适配时，以令所述多个推理语音标记集合中对照语音标记集合对应的推理置信水平最大为第一方向，依据所述第一方向和所述多个推理语音标记集合的推理置信水平，基于所述第一误差确定函数得到第一误差值；在所述第二选定预设语音对象与所述对照分类先验信息不适配时，以令所述多个推理语音标记集合中目标推理语音标记集合对应的推理置信水平最大为第二方向，依据所述第二方向和所述多个推理语音标记集合的推理置信水平，基于所述第一误差确定函数得到第一误差值，所述目标推理语音标记集合中各语音对象标记都表征不是任意一个所述预设语音对象。

12、第二方面，本技术提供一种计算机系统，所述计算机系统为学习型电动玩具或与学习型电动玩具通信的后台设备，所述计算机系统，所述计算机系统包括：一个或多个处理器；存储器；一个或多个计算机程序；其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个计算机程序被所述处理器执行时，实现如上所述的方法。

13、本技术的有益效果至少包括：本发明实施例基于依据行为表征数组确定语音表征数组中在行为表征数组中具有牵涉语义表征的核心语音表征数组，并依据行为表征数组和核心语音表征数组进行整合获得整合表征数组，将整合表征数组嵌入至预设特征域得到整合嵌入表征数组，以将语音数据中表征的情绪、精神状态等信息和具有相同信息的行为表征数组进行对齐，完成特征整合，在依据整合嵌入表征数组进行目标语音解析并依据目标语音标记集合对拟分析行为交互数据进行语音标记时，增加识别可靠性，从而提供更好的互动控制，为用户带来更好的交互体验。

14、在后面的描述中，将部分地陈述其他的特征。在检查后面内容和附图时，本领域的技术人员将部分地发现这些特征，或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面，当前申请中的特征可以被实现和获得。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李恺
技术所有人：广东实丰智能科技有限公司
我是此专利的发明人