一种语音功能遥控开启方法及装置与流程

文档序号：12368746阅读：722来源：国知局

本发明涉及智能语音交互技术，尤其涉及一种语音功能遥控开启方法及装置。

背景技术：

随着计算机技术的普及，当今人们的生活已经逐渐走入智能时代。不仅仅是电脑，手机，PAD，人们的衣食住行的方方面面都开始应用出现不久的智能技术，智能电视，智能导航，智能家居等等，智能技术将在人们生活的各个方面提供方便快捷的服务。智能语音交互是基于语音输入的新一代交互模式，通过说话就可以得到反馈结果。典型的应用场景—语音助手。自从iPhone 4S推出Siri后，智能语音交互应用得到飞速发展。中文典型的智能语音交互应用如：虫洞语音助手、讯飞语点已得到越来越多的用户认可。

一般语音功能主体是手机或者平板电脑，在日常使用时可以很方便地点击开启语音功能。但如果在开车时使用语音功能，驾驶员需要点击手机屏幕或者按键来开启语音功能，这样的操作过程极容易使得驾驶员分心，引起交通事故的几率很高，安全性不佳。另外，在手机或平板电脑远离用户一段距离时，用户需要去找到手机或平板电脑才能点击开启语音功能，使用方便性不佳。再者，在佩戴耳机去运动的过程中，譬如跑步、骑车、散步等，若要开启语音功能也需要在手机或平板电脑上点击开启语音功能，使用方便性同样不高。

以上场景中可以看出，手机或平板电脑均不方便直接点击开启语音控制进行操作(播放音乐或者拨打接听电话等)，但手机或平板电脑可以作为载体，由遥控设备(耳机或者其他)开启手机或平板电脑上的语音功能，因此有必要开发可以遥控开启语音功能的技术。

技术实现要素：

本发明的目的在于为克服现有技术的缺陷，而提供一种语音功能遥控开启方法及装置，使其可以遥控开启语音功能。

为实现上述目的，本发明采用以下技术方案：

一种语音功能遥控开启方法，其用于在遥控端开启移动端上的语音功能，其包括以下步骤：

激活步骤，遥控端向移动端发出功能命令；

判断步骤，移动端接收到功能命令之后判断其中是否带有激活语音功能命令及判断移动端是否正在处理未完成的命令；

录制步骤，开启移动端麦克风或者遥控端麦克风进行语音录制；

识别步骤，对录制的语音进行识别和语义分析，得出语音控制命令。

进一步地，在激活步骤中，通过遥控端的按键触发功能命令发送至移动端；或者在激活步骤中，通过遥控端麦克风监听功能命令发送至移动端。

进一步地，判断步骤包括：

移动端接收功能命令，并分析功能命令中是否带有激活语音功能命令；

如果不带有激活语音功能命令，则移动端直接执行其他功能命令；

如果带有激活语音功能命令，则移动端判断是否有未处理完成的命令，如果有则退出，如果没有则进入录制步骤。

进一步地，录制步骤包括：

移动端判断遥控端是否有麦克风；

若遥控端没有麦克风，则开启移动端的麦克风进行语音录制；

若遥控端有麦克风，则移动端进一步判断遥控端的麦克风是否允许打开；

若遥控端的麦克风不允许打开，则开启移动端的麦克风进行语音录制；

若遥控端的麦克风允许打开，则开启遥控端的麦克风进行语音录制。

进一步地，识别步骤包括：

将录制到的语音文件传送至服务器中识别成对应文字；

识别出的文字内容返回移动端进行语义分析，得出相匹配的命令类型和参数。

本发明还公开了一种语音功能遥控开启装置，其用于在遥控端开启移动端上的语音功能，其包括：

激活模块，用于控制遥控端向移动端发出功能命令；

判断模块，用于控制移动端接收到功能命令之后判断其中是否带有激活语音功能命令及判断移动端是否正在处理未完成的命令；

录制模块，用于控制开启移动端麦克风或者遥控端麦克风进行语音录制；

识别模块，用于控制对录制的语音进行识别和语义分析，得出语音控制命令。

进一步地，激活模块通过遥控端的按键触发功能命令发送至移动端；或者激活模块通过遥控端麦克风监听功能命令发送至移动端。

进一步地，判断模块用于：

控制移动端接收功能命令，并分析功能命令中是否带有激活语音功能命令；

如果不带有激活语音功能命令，则控制移动端直接执行其他功能命令；

如果带有激活语音功能命令，则控制移动端判断是否有未处理完成的命令，如果有则退出，如果没有则调用录制模块。

进一步地，录制模块用于：

控制移动端判断遥控端是否有麦克风；

若遥控端没有麦克风，则控制开启移动端的麦克风进行语音录制；

若遥控端有麦克风，则控制移动端进一步判断遥控端的麦克风是否允许打开；

若遥控端的麦克风不允许打开，则控制开启移动端的麦克风进行语音录制；

若遥控端的麦克风允许打开，则控制开启遥控端的麦克风进行语音录制。

进一步地，识别模块用于：

将录制到的语音文件传送至服务器中识别成对应文字；

将识别出的文字内容进行语义分析并返回移动端，得出相匹配的命令类型和参数。

本发明与现有技术相比的有益效果是：

本发明通过遥控端开启移动端的语音功能，遥控端可以为手环、手表、指环或耳机之类的随身佩戴物品，因此方便了用户遥控启动语音功能，可以用在车内场景也可以用在运动的场景中，无需时刻将手机或平板电脑随时放在手边操作，满足了用户的需求，使用方便性得到提升，有利于市场推广。

附图说明

图1为本发明语音功能遥控开启方法的流程图；

图2为本发明语音功能遥控开启方法的详细流程图。

具体实施方式

为了更充分理解本发明的技术内容，下面结合具体实施例对本发明的技术方案作进一步介绍和说明。

本发明实施例语音功能遥控开启方法的流程图如图1所示，详细流程图如图2所示。

本实施例语音功能遥控开启方法用于在遥控端开启移动端上的语音功能。其中，遥控端可以是智能手环、智能手表、智能指环或者蓝牙耳机之类的随身佩戴的物品，以方便随时进行操作控制。移动端则可以是智能手机、平板电脑等设备。遥控端和移动端通过蓝牙建立无线连接，两者的数据和命令传输都是通过蓝牙无线实现。

如图1所示，语音功能遥控开启方法包括激活步骤S10、判断步骤S20、录制步骤S30和识别步骤S40。

如图2所示，在激活步骤S10中，遥控端向移动端发出功能命令。在本实施例中，在按下遥控端的按键时，遥控端向移动端发出功能命令，即功能命令的发出是由遥控端的按键按下触发的。而在其他实施例中，也可以由遥控端的触摸屏被点击而触发。或者，在其他实施例中，在激活步骤中，通过遥控端麦克风监听功能命令发送至移动端，此处监听到的功能命令应该至少有一个启动关键词，譬如“你好，小A”，以区分开功能命令和普通对话。

在判断步骤S20中，移动端接收到功能命令之后判断其中是否带有激活语音功能命令及判断移动端是否正在处理未完成的命令。判断步骤S20是录制步骤S30之前的步骤，作用是确认是否支持开启语音功能以及是否有前序功能命令会阻挡语音控制命令的执行。

如图2所示，判断步骤S20包括：

步骤S21，移动端接收功能命令，并分析功能命令中是否带有激活语音功能命令；

步骤S22，如果不带有激活语音功能命令，则移动端直接执行其他功能命令；

步骤S23，如果带有激活语音功能命令，则移动端判断是否有未处理完成的命令，如果有则退出，如果没有则进入录制步骤S30。

生产厂家为实现产品差异化，可将遥控端做成支持语音启动和不支持语音启动的两种，移动端的控制逻辑还是相同的，因此为保持两种遥控端按键数量一致，可采用按键共用的方式，一种遥控端的按键用于触发开启语音功能，而另一种遥控端的同一按键用于实现其他功能，譬如播放控制之类。在按键中新增开启语音功能可以通过在遥控端AVRCP协议增加开启语音功能逻辑语句来实现。因此移动端接收到遥控端发出的功能命令时，需要判断功能命令是否带有激活语音功能命令，也即是判断遥控端是否支持激活语音功能，即步骤S21。如果功能命令为普通的功能命令，而非激活语音功能命令，则移动端直接执行该功能命令，即步骤S22。如果功能命令是激活语音功能命令，则移动端再进一步判断是否有未处理完成的命令，即步骤S23，以避免出现生成的语音控制命令无法在移动端立即执行的情况。

如果移动端接收到的功能命令是通过遥控端麦克风监听到的，则移动端会将功能命令(即语音片段)传输到服务器中分析其中是否带有启动关键词，譬如“你好，小A”。如果未带有启动关键词，即表明此功能命令未包含激活语音功能命令。如果带有启动关键词，即表明此功能命令包含激活语音功能命令，移动端便进一步判断是否有未处理完成的命令。

在录制步骤S30中，需开启移动端麦克风或者遥控端麦克风进行语音录制。如图2所示，录制步骤S30具体包括：

步骤S31，移动端判断遥控端是否有麦克风；

步骤S32，若遥控端没有麦克风，则开启移动端的麦克风进行语音录制；

步骤S33，若遥控端有麦克风，则移动端进一步判断遥控端的麦克风是否允许打开，若遥控端的麦克风不允许打开，则开启移动端的麦克风进行语音录制；

步骤S34，若遥控端的麦克风允许打开，则开启遥控端的麦克风进行语音录制。

判断遥控端是否有麦克风可以通过判断遥控端是否支持蓝牙同步定向链接标准来实现。蓝牙同步定向链接标准即SCO连接，是蓝牙物理链路类型之一，其主要用来传输对时间要求很高的数据通信，譬如同步语音传送。

如果遥控端没有麦克风，则应该直接开启移动端麦克风进行语音录制。而如果遥控端有麦克风而遥控端的麦克风却不允许打开，也应该直接开启移动端麦克风进行语音录制。只有当遥控端有麦克风同时遥控端的麦克风允许打开，才可以开启遥控端麦克风进行语音录制。

在识别步骤S40中会对录制的语音进行识别和语义分析，得出语音控制命令。如图2所示，识别步骤S40具体包括：

步骤S41，将录制到的语音文件传送至服务器中识别成对应文字；

步骤S42，识别出的文字内容进行语义分析并返回移动端，得出相匹配的命令类型和参数。

步骤S41中，移动端会将录制到的语音文件送至服务器中识别，这里的服务器可以采用第三方的语音识别服务器，譬如科大讯飞。识别出文字之后便可进行下一步操作，但识别也会有出错的时候，如果识别出错，服务器返回识别出错的信息给移动端，移动端播放和现实识别出错的信息提示，最后退出整个语音过程。在其他实施例中，识别出错之后还可以提示用户重新录制语音命令，并跳转到录制的步骤，无须用户重新开启语音功能，以提高使用方便性。

在步骤S42中，识别出的文字内容需要在服务器中进行语义解析和自定义语义分析，当中的服务器同样可以采用第三方的语音识别服务器，譬如科大讯飞。语义分析所得结果返回移动端内，移动端预存有匹配关键词，语义分析结构和匹配关键词进行匹配之后可以将该条语音指令进行分类，即得到了该语音指令的命令类型和相关参数，譬如电话、音乐、地图、音频控制等。

本实施例的语音功能遥控开启装置，其用于在遥控端开启移动端上的语音功能，其包括激活模块、判断模块、录制模块和识别模块。

激活模块用于控制遥控端向移动端发出功能命令。激活模块通过遥控端的按键触发功能命令发送至移动端。或者激活模块通过遥控端麦克风监听功能命令发送至移动端。

判断模块用于控制移动端接收到功能命令之后判断其中是否带有激活语音功能命令及判断移动端是否正在处理未完成的命令。

具体地，判断模块用于：

控制移动端接收功能命令，并分析功能命令中是否带有激活语音功能命令；

如果不带有激活语音功能命令，则控制移动端直接执行其他功能命令；

如果带有激活语音功能命令，则控制移动端判断是否有未处理完成的命令，如果有则退出，如果没有则调用录制模块。

录制模块用于控制开启移动端麦克风或者遥控端麦克风进行语音录制。

具体地，录制模块用于：

控制移动端判断遥控端是否有麦克风；

若遥控端没有麦克风，则控制开启移动端的麦克风进行语音录制；

若遥控端有麦克风，则控制移动端进一步判断遥控端的麦克风是否允许打开；

若遥控端的麦克风不允许打开，则控制开启移动端的麦克风进行语音录制；

若遥控端的麦克风允许打开，则控制开启遥控端的麦克风进行语音录制。

识别模块用于控制对录制的语音进行识别和语义分析，得出语音控制命令。

具体地，识别模块用于：

将录制到的语音文件传送至服务器中识别成对应文字；

将识别出的文字内容进行语义分析并返回移动端，得出相匹配的命令类型和参数。

以上陈述仅以实施例来进一步说明本发明的技术内容，以便于读者更容易理解，但不代表本发明的实施方式仅限于此，任何依本发明所做的技术延伸或再创造，均受本发明的保护。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄天旭;谢德胜;
技术所有人：深圳市亚冠电子有限公司;
我是此专利的发明人

上一篇：车用工具组的制作方法与工艺
上一篇：一种基于车联网的智能服务系统的制作方法与工艺