一种基于动作引擎的语音交互方法、系统及存储介质与流程

文档序号：27081049发布日期：2021-10-24 12:34阅读：来源：国知局

技术特征：
1.一种基于动作引擎的语音交互方法，其特征在于，包括步骤：s1、获取用户的语音指令；s2、识别所述语音指令，确定对应的目标动作；s3、获取并识别当前界面，根据本地仲裁规则和当前界面，判断所述目标动作的技能属性；s4、控制动作引擎根据所述技能属性响应所述目标动作。2.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤s1包括：s11、获取唤醒指令唤醒语音交互模块；s12、获取用户发出的语音指令并输出至语音交互模块。3.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤s2包括：s21、识别所述语音指令得到语音文本；s22、解析所述语音文本，确认用户意图并确定对应的目标动作。4.如权利要求3所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤s3包括：s31、获取语音识别前的应用界面标记为当前界面；s32、识别所述当前界面确定其对应的应用界面，根据本地仲裁规则判断所述目标动作是否属于所述应用界面的可操作动作，若是则进入步骤s4，若否则判断为其它场景动作。5.如权利要求4所述的一种基于动作引擎的语音交互方法，其特征在于，在所述步骤s32中，所述本地仲裁规则具体为：根据所述目标动作对应的用户意图，在界面操控类中进行控件定位，若定位到适配的目标界面控件，则判断所述目标动作属于所述应用界面的可操作动作，否则判断为其它场景动作。6.如权利要求1所述的一种基于动作引擎的语音交互方法，其特征在于，所述步骤s4包括：s41、根据所述目标动作在界面操控类中匹配对应的目标界面控件、解析得到对应的操控意图；s42、根据所述操控意图生成对应的动作脚本并控制动作引擎执行。7.如权利要求5所述的一种基于动作引擎的语音交互方法，其特征在于：所述应用界面包括音乐场景界面、导航场景界面、车控设置场景界面；所述目标动作包括在界面上的滑动翻页意图、点击文本意图、文本输入意图。8.一种基于动作引擎的语音交互系统，其特征在于：包括依次连接的收音模块、语音识别模块、语音交互模块；所述收音模块用于获取用户的唤醒指令、语音指令；所述语音识别模块用于识别所述唤醒指令、所述语音指令，得到对应的语音文本；所述语音交互模块用于响应所述唤醒指令，启动语音交互功能；所述语音交互模块还用于响应所述语音指令，确定目标动作；获取并识别当前界面，判断所述目标动作的技能属性；并根据所述技能属性响应所述目标动作。9.如权利要求8所述的一种基于动作引擎的语音交互系统，其特征在于：所述语音交互
模块包括依次连接的语义理解模块、本地仲裁模块、脚本生成模块和动作引擎；所述语义理解模块用于解析所述语音文本，确认用户意图及对应的目标动作；所述本地仲裁模块用于识别所述当前界面确定其对应的应用界面，根据本地仲裁规则判断所述目标动作是否属于所述应用界面的可操作动作；所述脚本生成模块用于根据所述用户意图生成对应的动作脚本；所述动作引擎用于执行所述动作脚本。10.一种存储介质，其上存储有计算机程序，其特征在于：所述计算机程序用于被权利要求8
‑
9所述一种基于动作引擎的语音交互系统加载，以实现权利要求1
‑
7所述的一种基于实车的语音唤醒率测试方法。

技术总结
本发明涉及语音交互技术领域，提供一种基于动作引擎的语音交互方法、系统及存储介质，从动作引擎的驱动基础上着手，先根据用户的语音指令确定其目标动作，并在设置本地仲裁规则判断目标动作的技能属性，从而通过确定目标动作是否适用当前界面，来进一步的判断用户意图，进而控制根据技能属性响应目标动作。如此，使得用户可以借由语音指令在任何界面完成对应的实用操作，实现全局所见即可说、可说即可实现的语音交互控制，大幅度地扩大了设备可识别的语音指令集；另外，从动作引擎上响应目标动作，无需额外增加第三方应用适配，降低了设备的开发成本，提高了语音交互的可移植性与兼容性。容性。容性。

技术研发人员：朱渊谢志华王斌何川延银建军王武斌
受保护的技术使用者：惠州市德赛西威汽车电子股份有限公司
技术研发日：2021.06.02
技术公布日：2021/10/23

完整全部详细技术资料下载

当前第2页1 2