一种语音处理方法、装置、电子设备和存储介质与流程

文档序号：14838006发布日期：2018-06-30 13:14阅读：135来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及语音处理技术领域，具体涉及一种语音处理方法，一种语音处理装置、一种电子设备和一种计算机可读存储介质。

背景技术：

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术以及进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。

随着语音识别算法越来越强大，也变得越来越复杂，对于计算性能要求较高。很多低性能的电子设备上，现有的语音识别算法都无法取得良好效果。很多低性能的电子设备因此仅能运行对计算资源要求相对较低的语音识别算法，可以进行的语音处理受到限制。

技术实现要素：

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法，语音处理装置、电子设备和计算机可读存储介质。

依据本发明的一个方面，提供了一种语音处理方法，包括：

基于第一工作模式提供的第一语音处理功能，进行语音处理；

根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式；

基于第二工作模式提供的第二语音处理功能，进行语音处理。

可选地，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

可选地，所述方法还包括：

查找所述第一工作模式下运行的第一功能模块；

确定与所述第一功能模块对应的第一词库。

可选地，所述方法还包括：

查找所述第二工作模式下运行的第二功能模块；

确定与所述第二功能模块对应的第二词库。

可选地，所述第一词库位于本地，所述第二词库位于云端。

可选地，所述基于第一工作模式提供的第一语音处理功能包括：

基于本地的第一词库进行语音处理。

可选地，所述基于第二工作模式提供的第二语音处理功能包括：

将待识别语音发送至云端服务器；

接收所述云端服务器基于所述第二词库得到的语音处理结果。

可选地，所述根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式包括：

查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；

切换至第二工作模式。

可选地，所述查找所述状态切换词匹配的工作模式包括：

查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

可选地，在所述基于第二工作模式提供的第二语音处理功能，进行语音处理之前，所述方法还包括：

提取所述状态切换词对应的目标语音的在前语音和/或在后语音，作为基于第二语音处理功能进行处理的语音。

可选地，所述提取所述状态切换词对应的目标语音的在前语音和/或在后语音包括：

在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

可选地，所述提取所述状态切换词对应的目标语音的在先语音和/或在后语音包括：

在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

可选地，所述方法还包括：

确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；

将所述电子设备切换回所述第一工作模式。

根据本发明的另一方面，提供了一种语音处理装置，包括：

第一语音处理模块，用于基于第一工作模式提供的第一语音处理功能，进行语音处理；

模式切换模块，用于根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式；

第二语音处理模块，用于基于第二工作模式提供的第二语音处理功能，进行语音处理。

可选地，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

可选地，所述装置还包括：

第一查找模块，用于查找所述第一工作模式下运行的第一功能模块；

第一词库确定模块，用于确定与所述第一功能模块对应的第一词库。

可选地，所述装置还包括：

第二查找模块，用于查找所述第二工作模式下运行的第二功能模块；

第二词库确定模块，用于确定与所述第二功能模块对应的第二词库。

可选地，所述第一词库位于本地，所述第二词库位于云端。

可选地，所述第一语音处理模块，具体用于基于本地的第一词库进行语音处理。

可选地，所述第二语音处理模块包括：

发送子模块，用于将待识别语音发送至云端服务器；

结果接收子模块，用于接收所述云端服务器基于所述第二词库得到的语音处理结果。

可选地，所述模式切换模块包括：

模式查找子模块，用于查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；

模式切换子模块，用于切换至第二工作模式。

可选地，所述模式查找子模块，具体用于查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

可选地，所述装置还包括：

语音提取模块，用于在所述基于第二工作模式提供的第二语音处理功能，进行语音处理之前，提取所述状态切换词对应的目标语音的在前语音和/或在后语音，作为基于第二语音处理功能进行处理的语音。

可选地，所述语音提取模块包括：

后语音提取子模块，用于在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

可选地，所述语音提取模块包括：

前语音提取子模块，用于在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

可选地，所述装置还包括：

后语音确定模块，用于确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；

切换模块，用于将所述电子设备切换回所述第一工作模式。

根据本发明的另一方面，提供了一种电子设备，包括：

处理器；以及

被配置为存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述电子设备执行根据上述的语音处理方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得所述电子设备执行根据上述的语音处理方法。

根据本发明的上述语音处理方法和装置，通过基于第一工作模式提供的第一语音处理功能，进行语音处理，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式，基于第二工作模式提供的第二语音处理功能，进行语音处理。上述方法中实现了不同工作模式下以不同的语音处理功能进行语音处理，并可以根据状态切换词随时进行工作模式的切换，使得电子设备在进行语音处理时，可以根据需要调整语音处理能力，继而在低性能的电子设备上，实现在需要时根据语音控制电子设备可以调用其他设备的计算资源和语音处理算法，语音处理不再受到限制。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明实施例一的语音处理方法的步骤流程示意图；

图2示出了根据本发明实施例二的语音处理方法的步骤流程示意图；

图3示出了根据本发明实施例三的语音处理方法的步骤流程示意图；

图4示出了根据本发明实施例四的语音处理装置的示意性结构框图；

图5示意性地示出了用于执行根据本发明的计算设备的框图；以及

图6示意性地示出了用于保持或者携带实现根据本发明的程序代码的存储单元。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例所使用的电子设备可以包括各种形式，例如手机、平板、笔记本、可穿戴设备、智能摄像机、扫地机器人等，或者其他任意适用的设备，本发明实施例对此不做限制。

参照图1，示出了根据本发明实施例一的语音处理方法的步骤流程示意图，具体可以包括如下步骤：

步骤101，基于第一工作模式提供的第一语音处理功能，进行语音处理。

在本发明实施例中，语音处理包括对语音信号进行识别、理解并作出相应反馈的处理过程，包括将语音信号转换为相应的文本、或者命令，针对语音信息进行识别，并根据理解作出相应反馈，或者其他任意适用的处理，本发明实施例对此不做限制。

在本发明实施例中，工作模式用于对电子设备当前工作所能执行的操作、所处的状态、开启或关闭的软硬件模块等进行管理，或者其他任意适用的电子设备工作相关的内容，本发明实施例对此不做限制。在不同的工作模式下，电子设备所能进行的操作，所处的状态，所开启或关闭的软硬件模块也不同。例如，在一个工作模式下，电子设备可以调用摄像头，在另一个工作模式下，则限制电子设备调用摄像头；在一个工作模式下，电子设备可以与服务器建立连接，耗电较快，在另一个工作模式下，电子设备与服务器断开连接，耗电较慢。

在本发明实施例中，语音处理功能包括对于语音进行处理所调用的算法、数据库、以及计算资源等，或者其他任意适用的与语音处理相关的内容，本发明实施例对此不做限制。

例如，一个语音处理功能为仅调用本地的计算资源，利用本地的语音识别模型对语音信号进行识别，语音识别模型保存着从预先收集的语音信号中抽取的语音特征，可识别的语音相对限制于本地的语音模型中语音特征，识别的速度限制于本地的计算资源；另一个语音处理功能为利用远程服务器，将语音信号上传到远程服务器，调用远程服务器上的计算资源，利用语音识别模型对语音信号进行识别，并理解语音信号，对语音信号作出相应的反馈，不再限制于本地的计算资源和样本库，可以有更好的语音处理效果，得到更为复杂多样的结果。

在本发明实施例中，第一工作模式可以提供第一语音处理功能，第二工作模式可以提供第二语音处理功能。

步骤102，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式。

在本发明实施例中，状态切换词用于切换电子设备的工作模式，可以是语音、文本等形式，本发明实施例对此不做限制。状态切换词可以是电子设备的名称标识、或者针对工作模式的唤醒词等，或者其他任意适用的词，本发明实施例对此不做限制。

在本发明实施例中，基于第一语音处理功能，进行语音处理，识别到状态切换词，可以将语音信号直接与第一语音处理功能的样本语音进行匹配，确定语音为状态切换词，或者可以基于第一语音处理功能对语音信号进行识别，将语音信号转换为文本，确定文本为状态切换词，或者其他任意适用的方式得到状态切换词，本发明实施例对此不做限制。

在本发明实施例中，在将电子设备切换至第二工作模式时，可以是根据状态切换词查找对应于状态切换词的第二工作模式进行切换，或者电子设备仅有两种工作模式，每次得到状态切换词后，切换为另一种工作模式即可，或者其他任意适用的方式，本发明实施例对此不做限制。

例如，基于第一语音处理功能，得到电子设备的名称标识，名称标识为状态切换词，将电子设备切换到第二工作模式。

步骤103，基于第二工作模式提供的第二语音处理功能，进行语音处理。

在本发明实施例中，第一工作模式可以提供第二语音处理功能，基于第二语音处理功能，进行语音处理。

根据本发明的上述语音处理方法，通过基于第一工作模式提供的第一语音处理功能，进行语音处理，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式，基于第二工作模式提供的第二语音处理功能，进行语音处理。上述方法中实现了不同工作模式下以不同的语音处理功能进行语音处理，并可以根据状态切换词随时进行工作模式的切换，使得电子设备在进行语音处理时，可以根据需要调整语音处理能力，继而在低性能的电子设备上，实现在需要时根据语音控制电子设备可以调用其他设备的计算资源和语音处理算法，语音处理不再受到限制。

在本发明实施例中，优选地，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

词库是指用于语音处理时所使用的词库，包括语音识别时用于与匹配语音信号进行匹配的词库，或者用于将语音转换为文本时所使用的词库，或者用于训练语音识别模型的词库，或者其他任意适用的与语音处理相关的词库，本发明实施例对此不做限制。

对应于第一语音处理功能的词库，记为第一词库，对应于第二语音处理功能的词库，记为第二词库。第一语音处理功能可以基于第一词库进行语音处理功能，第二语音处理功能可以基于第二词库进行语音处理功能。第一词库和第二词库中包括的词可以不同，词的数量也可以不同，由此第一语音处理功能和第二语音处理功能的语音处理能力也不同。

在本发明实施例中，优选地，所述方法还包括：查找所述第一工作模式下运行的第一功能模块；确定与所述第一功能模块对应的第一词库。

功能模块是指由软件实现的功能、或者由硬件实现的功能等，包括可执行代码的集合、硬件部件等，或者其他任意适用的，本发明实施例对此不做限制。例如，智能设备上的摄像头。

第一工作模式下运行多个功能模块，查找第一功能模块，确定与第一功能模块对应的第一词库，例如，第一词库为控制摄像头的命令词库，以实现对于摄像头的语音控制。

在本发明实施例中，优选地，所述方法还包括：查找所述第二工作模式下运行的第二功能模块；确定与所述第二功能模块对应的第二词库。

相应的，第二工作模式下运行多个功能模块，查找第二功能模块，确定与第二功能模块对应的第二词库，以实现对于第二功能模块的语音控制。

在本发明实施例中，优选地，所述根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式包括：查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；切换至第二工作模式。

工作模式可以与状态切换词对应，不同的状态切换词对应不同的工作模式，查找与状态切换词匹配的工作模式，确定为第二工作模块。

在本发明实施例中，优选地，所述查找所述状态切换词匹配的工作模式包括：查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

状态切换词包括多个词，其中可以包括关键词，或者状态切换词包括一段语音，其中可以包括目标语音。音频参数包括音频的音量、音调、音色等，或者其他任意适用的参数，本发明实施例对此不做限制。

不同的关键词、或不同的目标语音的音频参数可以与不同的工作模式匹配，查找状态切换词包括的关键词，和/或目标语音的音频参数匹配的工作模式。

参照图2，示出了根据本发明实施例二的语音处理方法的步骤流程示意图，具体可以包括如下步骤：

步骤201，基于本地的第一词库进行语音处理。

在本发明实施例中，第一词库位于本地，第二词库位于云端。基于本地的第一词库进行语音处理，例如，将语音信号直接与本地的第一词库进行语音识别，并返回识别结果。基于第一词库进行语音处理可以包括任意适用的处理，本发明实施例对此不做限制。

步骤202，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式。

在本发明实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，本发明实施例对此不做限制。

步骤203，将待识别语音发送至云端服务器。

在本发明实施例中，在第二工作模式下，将待识别语音发送至云端服务器。

步骤204，接收所述云端服务器基于所述第二词库得到的语音处理结果。

在本发明实施例中，云端服务器基于第二词库得到语音处理结果后，将语音处理结果发送回本地，接收语音处理结果，完成针对待识别语音的语音处理。

根据本发明的上述语音处理方法，通过基于本地的第一词库进行语音处理，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式，将待识别语音发送至云端服务器，接收所述云端服务器基于所述第二词库得到的语音处理结果。上述方法中在进行语音处理时，基于本地的词库识别到状态切换词，据此切换电子设备的工作模式，调用云端服务器的计算资源和词库进行语音处理，实现了不同识别功能的切换。

参照图3，示出了根据本发明实施例三的语音处理方法的步骤流程示意图，具体可以包括如下步骤：

步骤301，基于第一工作模式提供的第一语音处理功能，进行语音处理。

在本发明实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，本发明实施例对此不做限制。

步骤302，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式。

在本发明实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，本发明实施例对此不做限制。

在本发明实施例中，优选地，所述方法还包括：确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；将所述电子设备切换回所述第一工作模式。

在采集到状态切换词之后采集到的语音，记为在后语音。第二设定时间可以根据实际需要设置，本发明实施例对此不做限制。确定识别到状态切换词之后第二设定时间内未采集到在后语音，表明电子设备没有待识别的语音，可以将电子设备切换回第一工作模式。

步骤303，提取所述状态切换词对应的目标语音的在前语音和/或在后语音，作为基于第二语音处理功能进行处理的语音。

在本发明实施例中，采集到状态切换词对应的目标语音后，提取目标语音之前的在前语音，和/或目标语音之后的在后语音，作为基于第二语音处理功能处理的语音。

在本发明实施例中，优选地，所述提取所述状态切换词对应的目标语音的在前语音和/或在后语音包括：在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

第一设定时间可以根据实际需要设置，本发明实施例对此不做限制。在目标语音之后的第一设定时间内，如果采集到在后语音，则提取在后语音作为基于第二语音处理功能进行处理的语音。

在本发明实施例中，优选地，所述提取所述状态切换词对应的目标语音的在先语音和/或在后语音包括：在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

如果没有采集到在后语音，则提取在前语音作为基于第二语音处理功能进行处理的语音。如果在前语音也没有采集到，则表明没有带处理的语音。

步骤304，基于第二工作模式提供的第二语音处理功能，进行语音处理。

在本发明实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，本发明实施例对此不做限制。

根据本发明的上述语音处理方法，通过基于第一工作模式提供的第一语音处理功能，进行语音处理，根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式，提取所述状态切换词对应的目标语音的在前语音和/或在后语音，作为基于第二语音处理功能进行处理的语音，基于第二工作模式提供的第二语音处理功能，进行语音处理。上述方法中实现了不同工作模式下以不同的语音处理功能进行语音处理，并可以根据状态切换词随时进行工作模式的切换，使得电子设备在进行语音处理时，可以根据需要调整语音处理能力，继而在低性能的电子设备上，实现在需要时根据语音控制电子设备可以调用其他设备的计算资源和语音处理算法，语音处理不再受到限制。

参照图4，示出了根据本发明实施例四的语音处理装置的示意性结构框图，具体可以包括如下模块：

第一语音处理模块401，用于基于第一工作模式提供的第一语音处理功能，进行语音处理；

模式切换模块402，用于根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式；

第二语音处理模块403，用于基于第二工作模式提供的第二语音处理功能，进行语音处理。

在本发明实施例中，优选地，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

在本发明实施例中，优选地，所述装置还包括：

第一查找模块，用于查找所述第一工作模式下运行的第一功能模块；

第一词库确定模块，用于确定与所述第一功能模块对应的第一词库。

在本发明实施例中，优选地，所述装置还包括：

第二查找模块，用于查找所述第二工作模式下运行的第二功能模块；

第二词库确定模块，用于确定与所述第二功能模块对应的第二词库。

在本发明实施例中，优选地，所述第一词库位于本地，所述第二词库位于云端。

在本发明实施例中，优选地，所述第一语音处理模块，具体用于基于本地的第一词库进行语音处理。

在本发明实施例中，优选地，所述第二语音处理模块包括：

发送子模块，用于将待识别语音发送至云端服务器；

结果接收子模块，用于接收所述云端服务器基于所述第二词库得到的语音处理结果。

在本发明实施例中，优选地，所述模式切换模块包括：

模式查找子模块，用于查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；

模式切换子模块，用于切换至第二工作模式。

在本发明实施例中，优选地，所述模式查找子模块，具体用于查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

在本发明实施例中，优选地，所述装置还包括：

在本发明实施例中，优选地，所述语音提取模块包括：

后语音提取子模块，用于在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

在本发明实施例中，优选地，所述语音提取模块包括：

前语音提取子模块，用于在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

在本发明实施例中，优选地，所述装置还包括：

后语音确定模块，用于确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；

切换模块，用于将所述电子设备切换回所述第一工作模式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的语音处理方法和装置的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

本发明实施例提供了一种电子设备，包括处理器；以及被配置为存储计算机可执行指令的存储器，可执行指令在被执行时使所述电子装置执行根据上文任意实施例的语音处理方法。

本发明实施例还提供了一种计算机存可读储介质，其中，计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得电子设备执行根据上文任意实施例的语音处理方法。

例如，图5示出了可以实现基于语音处理方法的计算设备，即上文中的电子设备。该计算设备传统上包括处理器510和存储器520形式的计算机程序产品或者计算机可读介质。存储器520可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器520具有存储用于执行上述方法中的任何方法步骤的程序代码531的存储空间530。例如，存储程序代码的存储空间530可以存储分别用于实现上面的方法中的各种步骤的各个程序代码531。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图6所示的便携式或者固定存储单元。该存储单元可以具有与图5的计算设备中的存储器520类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括用于执行本发明的方法步骤的计算机可读代码531′，即可以由诸如510之类的处理器读取的代码，当这些代码由计算设备运行时，导致该计算设备执行上面所描述的方法中的各个步骤。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明还公开了A1、一种语音处理方法，包括：

基于第一工作模式提供的第一语音处理功能，进行语音处理；

根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式；

基于第二工作模式提供的第二语音处理功能，进行语音处理。

A2、根据A1所述的方法，其中，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

A3、根据A2所述的方法，其中，所述方法还包括：

查找所述第一工作模式下运行的第一功能模块；

确定与所述第一功能模块对应的第一词库。

A4、根据A2所述的方法，其中，所述方法还包括：

查找所述第二工作模式下运行的第二功能模块；

确定与所述第二功能模块对应的第二词库。

A5、根据A2所述的方法，其中，所述第一词库位于本地，所述第二词库位于云端。

A6、根据A5所述的方法，其中，所述基于第一工作模式提供的第一语音处理功能包括：

基于本地的第一词库进行语音处理。

A7、根据A5所述的方法，其中，所述基于第二工作模式提供的第二语音处理功能包括：

将待识别语音发送至云端服务器；

接收所述云端服务器基于所述第二词库得到的语音处理结果。

A8、根据A1所述的方法，其中，所述根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式包括：

查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；

切换至第二工作模式。

A9、根据A8所述的方法，其中，所述查找所述状态切换词匹配的工作模式包括：

查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

A10、根据A1所述的方法，其中，在所述基于第二工作模式提供的第二语音处理功能，进行语音处理之前，所述方法还包括：

提取所述状态切换词对应的目标语音的在前语音和/或在后语音，作为基于第二语音处理功能进行处理的语音。

A11、根据A10所述的方法，其中，所述提取所述状态切换词对应的目标语音的在前语音和/或在后语音包括：

在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

A12、根据A10所述的方法，其中，所述提取所述状态切换词对应的目标语音的在先语音和/或在后语音包括：

在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

A13、根据A1所述的方法，其中，所述方法还包括：

确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；

将所述电子设备切换回所述第一工作模式。

本发明还公开了B14、一种语音处理装置，包括：

第一语音处理模块，用于基于第一工作模式提供的第一语音处理功能，进行语音处理；

模式切换模块，用于根据基于第一语音处理功能得到的状态切换词，将电子设备切换至第二工作模式；

第二语音处理模块，用于基于第二工作模式提供的第二语音处理功能，进行语音处理。

B15、根据B14所述的装置，其中，所述第一语音处理功能包括基于第一词库进行语音处理，所述第二语音处理功能包括基于第二词库进行语音处理。

B16、根据B15所述的装置，其中，所述装置还包括：

第一查找模块，用于查找所述第一工作模式下运行的第一功能模块；

第一词库确定模块，用于确定与所述第一功能模块对应的第一词库。

B17、根据B15所述的装置，其中，所述装置还包括：

第二查找模块，用于查找所述第二工作模式下运行的第二功能模块；

第二词库确定模块，用于确定与所述第二功能模块对应的第二词库。

B18、根据B15所述的装置，其中，所述第一词库位于本地，所述第二词库位于云端。

B19、根据B18所述的装置，其中，所述第一语音处理模块，具体用于基于本地的第一词库进行语音处理。

B20、根据B18所述的装置，其中，所述第二语音处理模块包括：

发送子模块，用于将待识别语音发送至云端服务器；

结果接收子模块，用于接收所述云端服务器基于所述第二词库得到的语音处理结果。

B21、根据B14所述的装置，其中，所述模式切换模块包括：

模式查找子模块，用于查找所述状态切换词匹配的工作模式，并将查找的工作模式确定为第二工作模式；

模式切换子模块，用于切换至第二工作模式。

B22、根据B21所述的装置，其中，所述模式查找子模块，具体用于查找与所述状态切换词所包括的关键词和/或所述状态切换词对应的目标语音的音频参数匹配的工作模式。

B23、根据B14所述的装置，其中，所述装置还包括：

B24、根据B23所述的装置，其中，所述语音提取模块包括：

后语音提取子模块，用于在所述目标语音之后的第一设定时间内，若采集到在后语音，则提取所述在后语音。

B25、根据B23所述的装置，其中，所述语音提取模块包括：

前语音提取子模块，用于在所述目标语音之后的第一设定时间内，若未采集到在后语音，则提取所述在前语音。

B26、根据B14所述的装置，其中，所述装置还包括：

后语音确定模块，用于确定识别到所述状态切换词之后第二设定时间内未采集到在后语音；

切换模块，用于将所述电子设备切换回所述第一工作模式。

本发明还公开了C27、一种电子设备，包括：

处理器；以及

被配置为存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述电子设备执行根据A1-A13任一个所述的语音处理方法。

本发明还公开了D28、一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得所述电子设备执行根据A1-A13任一个所述的语音处理方法。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：章勋
技术所有人：北京视觉世界科技有限公司
我是此专利的发明人

上一篇：一种自学习声纹识别的更新方法和装置与流程
上一篇：语音推送方法、装置、智能设备和存储介质与流程