语音操控系统的制作方法

文档序号：9248996阅读：485来源：国知局

语音操控系统的制作方法
【技术领域】
[0001]本发明涉及语音识别技术、图像识别技术、文本识别技术、动作模拟技术和蓝牙技术。
【背景技术】
[0002]开车时用手操控车载娱乐系统危险性非常大。
[0003]当前智能家居、智能穿戴、智能玩具对于语音操控的需求越来越强烈。
[0004]在医疗等领域很多人士手不方便操作终端，需要操控一些智能设备极其不便利。
[0005]如何通过语音有效的操控各种智能设备是目前急需解决的问题。

【发明内容】

[0006]本发明的目的在于解决上述问题，提供了一种语音操控系统，提升了车载终端、手机、智能家居、移动互联等各类应用操作的便利性，让操控交互更简单，更人性化。
[0007]语音操控系统技术方案如下描述。
[0008]系统自定义命令和系统截取屏幕并识别图片中可操作区域，可操作区域包括图标、按钮、文本标签等界面控件，然后生成对应的命令集库。
[0009]系统采集语音，通过在线或离线的方式对语音进行识别为文字。
[0010]系统匹配文字与命令集库，识别语音控制命令。
[0011]系统模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标。
[0012]根据本发明的语音操控系统的一实施例，语音识别和命令识别由系统的语音命令识别层实现。
[0013]根据本发明的语音操控系统的一实施例，应用的操作由系统的操作执行层完成。
[0014]根据本发明的语音操控系统的一实施例，语音操控系统状态包括初期空闲、开始提示、采集语音、语音识别、命令匹配结果提示、操作执行。
[0015]用户端遥控器包括蓝牙遥控器，用于接收用户按键事件传输至智能终端。
[0016]智能终端包括图形和文本识别模块、语音识别命令模块和操作执行模块，各模块功能如下。
[0017]图形和文本识别模块，把自定义的命令和截图识别的可操作区域命令汇合生成命令集库。
[0018]语音识别命令模块，就采样的语音识别为文字，然后和命令集库匹配识别语音控制命令。
[0019]操作执行模块，模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标。
[0020]本发明对比现有技术有如下的有益效果:本发明的方案是对现有应有界面识别其可操作区域动态生成命令集库，在语音识别之后进行语音命令的识别，然后模拟相应的操作动作或通知应用执行。相较于传统技术，本发明可以执行应用的任何命令，而传统的技术只能支持几个常用的命令，每次添加命令都需要底层深度定制；本发明可以推广到接受语音操控的各种只能终端，包括但不限于智能手机、智能车载、智能穿戴、智能家居、智能医疗、智能玩具等可以接受语音输入的用户终端。
【附图说明】
[0021]图1示出了本发明的语音操控系统的较佳实施例的流程图。
[0022]图2示出了本发明的语音操控系统的较佳实施例的业务逻辑图。
【具体实施方式】
[0023]下面结合附图和实施例对本发明作进一步的描述。
[0024]图1示出了本发明的语音操控系统的较佳实施例的流程。请参见图1，本实施例的语音操控系统的实施步骤详述如下。
[0025]步骤100:系统自定义命令和系统截取屏幕并识别图片中可操作区域，可操作区域包括图标、按钮、文本标签等界面控件，然后生成对应的命令集库。
[0026]步骤102:系统采集语音，通过在线或离线的方式对语音进行识别为文字。
[0027]步骤104:系统匹配文字与命令集库，识别语音控制命令。
[0028]图2示出了本发明的语音操控系统的较佳实施例的业务逻辑图，请参见图2，本实施例的语音操控系统包括用户端遥控器20和智能终端60。
[0029]用户端遥控器20包括蓝牙遥控器，用于接收用户按键事件传输至智能终端。智能终端60包括图形和文本识别模块602、语音命令识别模块604和操作执行模块606。语音命令识别模块604对采样的语音进行识别后转化成文字并对转化后的文字进行命令识别。操作执行模块606模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标。
[0030]例如，用户打开车载导航，用户点击蓝牙遥控器语音开始键，说出“搜地点”命令。
[0031]从用户的角度看，用户的控制命令与可操作区域是对应匹配的:“搜地点”对应界面中的搜地点文本框可操作取悦，“景点”命令对应界面中的标签可操作区域，“播放”命令对应播放器界面中的播放图标，界面中的可操作区域，可操作区域包括图标、按钮、文本标签等界面控件都是语音命令，另外还有系统自定义的语音命令，譬如“Home”返回主菜单界面等。
[0032]系统截取当前和屏幕识别可操作区域结合系统自定义的命令生成命令集库。
[0033]系统识别出“搜地点”语音文本，然后和命令集库匹配识别出“搜地点”命令。
[0034]步骤106:模拟控制命令“搜地点”对应的操控动作或通知应用进行操作，跳转到下一个操作界面，实现语音操控目标。
[0035]上述实施例是提供给本领域一般技术人员来实现和使用本发明的，本领域一般技术人员可在不脱离本发明的思想的情况下，对上述实施例做出种种修改或变化，因而本发明的保护范围并不被上述实施例所限，而应该是符合权利要求书所提到的创新性特征的最大范围。
【主权项】
1.一种语音操控系统，包括: 系统自定义命令和系统截取屏幕并识别图片中可操作区域，可操作区域包括图标、按钮、文本标签等界面控件，然后生成对应的命令集库；系统采集语音，通过在线或离线的方式对语音进行识别为文字；系统匹配文字与命令集库，识别语音控制命令；系统模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标；用户端遥控器包括蓝牙遥控器，用于接收用户按键事件传输至智能终端；智能终端包括图形和文本识别模块、语音识别命令模块和操作执行模块，各模块功能如下: 图形和文本识别模块，把自定义的命令和截图识别的可操作区域命令汇合生成命令集库；语音识别命令模块，就采样的语音识别为文字，然后和命令集库匹配识别语音控制命令；操作执行模块，模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标。2.根据权利要求1所述的语音操控系统，其特征在于，命令集库是图形和文本识别层来实现的。3.根据权利要求1所述的语音操控系统，其特征在于，语音识别和语音控制命令识别由系统的语音命令识别层实现。4.根据权利要求1所述的语音操控系统，其特征在于，应用的操作由系统的操作执行层模拟用户操作动作或通知应用执行来实现。5.根据权利要求1所述的语音操控系统，其特征在于，语音操控系统状态包括初期空闲、开始提示、采集语音、语音识别、命令匹配结果提示、操作执行。6.根据权利要求2所述的语音操控系统，其特征在于，识别的屏幕界面可操作区域包括图标、按钮、文本标签、文本输入框、文字导航等一切用户可进行动作操作的区域。7.根据权利要求3所述的语音操控系统，其特征在于，语音识别包括在线云平台和离线的语音识别库两种方式实现。8.根据权利要求4所述的语音操控系统，其特征在于，模拟的用户操作动作包括单击、双击、拖拽、多点触摸、横划等交互动作。
【专利摘要】本发明提供了一种语音操控系统，提升了车载终端、手机、智能家居、移动互联等各类应用操作的便利性，让操控交互更简单，更人性化。语音操控系统技术方案如下描述：系统自定义命令和系统截取屏幕并识别图片中可操作区域，可操作区域包括图标、按钮、文本标签等界面控件，然后生成对应的命令集库；系统采集语音，通过在线或离线的方式对语音进行识别为文字；系统匹配文字与命令集库，识别语音控制命令；系统模拟控制命令对应的操控动作或通知应用进行操作，实现语音操控目标。
【IPC分类】G06F3/01
【公开号】CN104965596
【申请号】CN201510440736
【发明人】钱安保
【申请人】上海宝宏软件有限公司
【公开日】2015年10月7日
【申请日】2015年7月24日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：钱安保;
技术所有人：上海宝宏软件有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。