一种语音操作方法及装置与流程

文档序号：11546308阅读：679来源：国知局

本发明属于语音识别领域，尤其涉及一种语音操作方法及装置。

背景技术：

现在的超级应用越来越多，例如微信已经成为一个超级app，社交、资讯、游戏、邮箱、音乐、地图、购物、支付、理财、生活服务等各种功能一应俱全，由此带来的遗憾是，微信越来越臃肿了，其负面作用是，用户不论使用任何功能，都只能按照用户的，一步步的操作。这要求用户不仅要准确地记住微信的功能的入口，就算记住了也要进行繁琐的操作，才能调用相关功能，系统的学习成本和操作复杂度都太高。

技术实现要素：

本发明实施例的目的在于提供一种语音操作方法，旨在解决目前的控制方式，打开功能模块的步骤繁琐，操作复杂度高的问题。

本发明实施例是这样实现的，一种语音操作方法，包括：

配置语音输入的触发操作；

利用所述语音输入的触发操作，接收并识别输入的语音信号，生成语音输入文本；

根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

本发明实施例的另一目的在于提供一种语音操作装置，包括：

配置模块，用于配置语音输入的触发操作；

识别模块，用于利用所述语音输入的触发操作，接收并识别输入的语音信号，生成语音输入文本；

操作模块，用于根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

在本发明实施例中，根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作，解决了目前的控制方式，打开功能模块的步骤繁琐，操作复杂度高的问题。有益效果在于将到达功能模块的操作路径和语音输入相结合，提升了控制功能模块的便捷性，进而提高了语音操作的效率。

附图说明

图1是本发明实施例提供的语音操作方法的实现流程图；

图2是本发明实施例提供的语音操作方法步骤s103的实现流程图；

图3是本发明实施例提供的语音操作方法较佳的流程示意图；

图4是本发明实施例提供的语音操作方法，在微信上使用的较佳示意图；

图5是本发明实施例提供的语音操作装置的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“倘若”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“倘若确定”或“倘若读取到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

实施例一

图1是本发明实施例提供的语音操作方法的实现流程图，详述如下：

在步骤s101中，配置语音输入的触发操作；

在步骤s102中，利用所述语音输入的触发操作，接收并识别输入的语音信号，生成语音输入文本；

其中，接收输入的语音信号时，屏蔽来电铃声、短信铃声以及闹铃声。

在步骤s103中，根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

其中，对所述语音输入文本进行解析，获取到待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

其中，所述预设操作包括点击操作、按压操作、选择操作之一或其组合。

其中，获取到达所述功能模块的操作路径，利用获取到的操作路径，对所述功能模块执行预设操作。

其中，获取到达所述功能模块的操作路径，具体为：

获取所述语音输入文本的关键词；

在记录的内容中，查找是否存在包括所述关键词的操作路径；

倘若存在包括所述关键词的操作路径，且操作路径不止一条时，显示多个操作路径；

在预设时间内，检测指定的操作路径；

倘若在预设时间内，没有检测到指定的操作路径，则默认选择第一操作路径作为到达所述功能模块的操作路径。

其中，倘若存在包括所述关键词的操作路径，且操作路径不止一条时，显示多个操作路径，具体为：

倘若存在包括所述关键词的操作路径，且操作路径不止一条时，获取操作路径的使用次数，按使用次数的高低，依次显示多个操作路径。

其中，操作路径以缩略简图的方式显示。

其中，以关键词为华夏星光举例，如果华夏星光出现在联系人列表、消息列表或者影院，则出现这三个地方的缩略简图，由用户选择。

其中，采集具备语音输入权限的功能模块的操作路径，通过存储具备语音输入权限的功能模块的操作路径，生成配置文件profile。

其中，配置具备语音输入权限的功能模块，具体为：

显示功能模块列表，所述功能模块列表中包括系统中的功能模块；

检测在所述功能模块列表中指定的功能模块；

获取指定的功能模块；

为指定的功能模块配置语音输入权限。

在本发明实施例中，通过根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作，有益效果在于以下几个方面，详述如下：

第一方面，通过配置语音输入的触发操作，当用户对移动终端的操作为语音输入的触发操作时，调起麦克风输入接口进行语音输入操作，相比原有的打开应用程序—点击搜索框操作—调用输入法(文本输入或语音输入)—触发搜索操作，需要的四步操作，变为只需要按住输入语音、松开触发搜索一步操作，不但可以减少操作步骤、降低操作复杂度，而且系统就有了一个统一的语音输入操作的入口，从而可以降低语音输入的时间，提升系统使用效率。

第二方面，由于语音识别为一个系统级的操作，各个应用程序也就没有必要申请麦克风的使用权限，或者说，系统可以直接限制需要安装的应用程序使用麦克风功能，在大多数情况下，只有少数几个照相功能的应用程序可以使用麦克风，大多数只需要使用语音输入功能的应用程序不需要使用麦克风，这也有利于保护用户隐私；

第三方面，将到达功能模块的操作路径和语音输入相结合，提升了控制功能模块的便捷性，进而提高了语音操作的效率。

实施例二

本发明实施例描述了语音输入的触发操作的组成，详述如下：

所述语音输入的触发操作包括但不限于按住应用程序图标的操作、摇动移动终端的操作，拖拽应用程序图标到功能入口的操作、拖拽应用程序图标移动的操作,手指与图标区域大面积接触的操作以及按住设定按键后同时点击应用程序图标的操作之一或其组合。

实施例三

本发明实施例描述了当所述语音输入的触发操作为按住应用程序图标的操作时，语音操作方法步骤s102的实现流程，详述如下：

按住应用程序图标，接收并识别输入的语音信号，生成语音输入文本。

实施例四

本发明实施例描述了当所述语音输入的触发操作为按住应用程序图标的操作时，语音操作方法步骤s103的实现流程，详述如下：

松开所述应用程序图标，根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

实施例五

本发明实施例描述了当所述语音输入的触发操作不为按住应用程序图标的操作时，语音操作方法步骤s103的实现流程，详述如下：

根据所述语音输入文本获取待操作的功能模块，启动应用程序，获取所述应用程序到达功能模块的操作路径，利用所述操作路径，对所述功能模块执行预设操作；或者，

根据所述语音输入文本获取待操作的功能模块，获取直接到达功能模块的操作路径，利用直接到达功能模块的操作路径，对所述功能模块执行预设操作。

其中，直接到达所述功能模块的操作路径为：能够跳过功能模块所在的应用程序前面的功能层级，直接操作功能模块的路径。

其中，在利用直接到达所述功能模块的操作路径之前，还包括：

检测功能模块所在的应用程序是否支持输入参数；

倘若功能模块所在的应用程序不支持输入参数，则将语音输入的内容显示在粘贴板，便于从粘贴板中提取相关的内容，建立到达所述功能模块的操作路径。

其中，从粘贴板中提取相关的内容，通过建立提取到的关键词与功能模块之间的关联，建立直接到达所述功能模块的操作路径。

实施例六

图2是本发明实施例提供的语音操作方法步骤s103的实现流程图，详述如下：

在步骤s201中，检测所述语音输入文本的确认操作；

在步骤s202中，倘若所述语音输入文本得到确认，则关闭麦克风，启动应用程序，获取所述应用程序到达功能模块的操作路径，利用所述操作路径，对所述功能模块执行预设操作。

实施例七

本发明实施例描述了语音操作方法步骤s103的另一实现流程，详述如下：

根据所述语音输入文本获取待操作的功能模块，在到达所述功能模块的操作路径的配置文件profile基础上，从底层起，逐层产生模拟点击事件，直至到达所述功能模块的操作界面

实施例八

图3是本发明实施例提供的语音操作方法较佳的流程示意图；

1.检测到语音输入的触发操作；

通过检测用户对移动终端进行的操作，检测到语音输入的触发操作。

2.根据所述语音输入的触发操作，调用系统的语音输入接口，录音并将相关的语音进行识别，得到语音识别文本；

3.通过获取用户对语音识别文本的确认，判断语音识别是否正确，如果接收到取消操作，则关闭麦克风，系统不做任何操作；否则，如果松开应用程序图标，则关闭麦克风，并打开应用程序，并将所述输入的文本作为应用程序参数发送至所述应用程序；

如果接收到取消操作，表示用户不确认语音识别文本；

如果接收到松开应用程序图标的操作，表示用户确认语音识别文本。

4.根据所述输入参数，应用程序调用并执行相关的功能模块。对于不支持所述输入参数的应用程序，系统可以建立到达相关功能的操作路径的profile，并根据所述profile产生模拟用户点击的动作，直接到达相关功能模块，执行相关操作。

实施例九

图4是本发明实施例提供的语音操作方法，在微信上使用的较佳示意图，详述如下：

比如用户到其家附近的华夏星光是其常使用的功能之一，参照图4，按照目前的方式，用户在准确地记住操作路径的情况下，需要点击6次才能到达华夏星光的操作界面，点击顺序为：微信、我、钱包、电影演出赛事、影院、华夏星光。但如果采用本发明实施例中的语音操作方法，只需要一步就可以。其过程是：

1.建立微信各个功能模块的入口，图4是其中一个简单的缩略图。该入口可以是微信提供的各功能模块的应用程序接口api，也可以是系统建立的各功能模块的操作路径的配置文件profile，通过系统或用户维护和更新。

2.按住微信图标，调用系统的麦克风输入接口，录音并将相关的语音识别成文本；

3.获取用户对识别内容的确认，如果不正确，用户将手指向上滑动可以取消相关操作；否则，如果松开应用程序图标，则关闭麦克风，并打开应用程序，并将所述输入的文本作为应用程序参数发送至所述应用程序；

4.根据所述输入参数，应用程序调用并执行相关的功能模块。对于不支持所述输入参数的应用程序，系统可以建立到达相关功能的操作路径的profile，并根据所述profile产生模拟用户点击的动作，直接到达相关功能模块，执行相关操作。例如，参照图4，用户如果需要点击华夏星光，在系统已经建立好到达此功能模块的路径的profile基础上，系统软件从底层依次产生6次模拟点击事件，到达华夏星光的操作界面，点击顺序为：微信、我、钱包、电影演出赛事、影院、华夏星光，就可以很快地直接到达用户需要的相关功能模块。

其中，如果华夏星光出现在联系人列表、消息列表或者影院，则出现这三个地方的缩略简图，由用户选择，以提高语音操作方法的灵活性。

实施例十

图5是本发明实施例提供的语音操作装置的结构框图，该装置可以运行该装置可以运行于具备麦克风的用户设备中。用户设备包括但不限于移动电话、口袋计算机(pocketpersonalcomputer，ppc)、掌上电脑、计算机、笔记本电脑、个人数字助理(personaldigitalassistant，pda)、mp4、mp3。为便于说明，仅示出了与本实施例相关的部分。

为了便于说明，仅示出了与本实施例相关的部分。

参照图5，该语音操作装置，包括：

配置模块51，用于配置语音输入的触发操作；

识别模块52，用于利用所述语音输入的触发操作，接收并识别输入的语音信号，生成语音输入文本；

操作模块53，用于根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

作为本实施例的一种实现方式，在所述语音操作装置中，所述语音输入的触发操作包括按住应用程序图标的操作、摇动移动终端的操作，拖拽应用程序到功能入口的操作、拖拽应用程序图标移动的操作,手指与图标区域大面积接触的操作以及按住设定按键后同时点击应用程序图标的操作之一或其组合。

作为本实施例的一种实现方式，在所述语音操作装置中，所述识别模块具体用于按住应用程序图标，接收并识别输入的语音信号，生成语音输入文本；

所述操作模块具体用于松开所述应用程序图标，根据所述语音输入文本获取待操作的功能模块，利用到达所述功能模块的操作路径，对所述功能模块执行预设操作。

作为本实施例的一种实现方式，在所述语音操作装置中，所述操作模块具体用于根据所述语音输入文本获取待操作的功能模块，启动应用程序，获取所述应用程序到达功能模块的操作路径，利用所述操作路径，对所述功能模块执行预设操作；或者，

作为本实施例的一种实现方式，在所述语音操作装置中，所述操作模块，还包括：

检测单元，用于检测所述语音输入文本的确认操作；

操作单元，用于倘若所述语音输入文本得到确认，则关闭麦克风，启动应用程序，获取所述应用程序到达功能模块的操作路径，利用所述操作路径，对所述功能模块执行预设操作。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本发明实施例装置和装置中的单元可以根据实际需要进行合并、划分和删减。

本发明实施例提供的装置可以应用在前述对应的方法实施例中，详情参见上述实施例的描述，在此不再赘述。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现。所述的程序可以存储于可读取存储介质中，所述的存储介质，如随机存储器、闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件执行本发明各个实施例所述的方法。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王晓炜;彭春祥;胡旭辉
技术所有人：深圳市全智达科技有限公司
我是此专利的发明人

上一篇：一种汽车传动三销轴万向节的制造方法与工艺
上一篇：变色少烟温灸器的制造方法与工艺