语音识别控制系统和方法

文档序号:6335796阅读:1349来源:国知局
专利名称:语音识别控制系统和方法
技术领域
本发明实施例涉及语音控制技术,尤其涉及一种语音识别控制系统和方法。
背景技术
电视、电脑、手机等显示终端的业务操作,对普通家庭用户,特别是对于老人或者 孩子来说,手动操作方法复杂。通过语音控制终端设备的业务操作可以简化操作方法,例 如,用户可以在手机中通过语音查电话号码、写短信等。当前,通过语音控制终端设备的应用单元,通常有两种方式。一种方式为将语音 识别模块与某一特定的应用单元绑定,将语音识别模块的语音识别能力作为特定的应用单 元的能力,在这种情况下,语音识别能力不能被其他的应用单元使用,无法通用。另一种方 式为终端设备提供公用的语音识别模块,设备中的其它应用单元通过特定的应用编程接 口(API)调用语音识别模块,以获取语音识别能力;在这种情况下,在终端中不能由多个设 备同时使用语音识别模块,存在局限性。综上所述现有技术中语音控制的适用范围小,且不能通用。

发明内容
本发明提供一种语音识别控制系统和方法,用以解决现有技术中语音控制的适用 范围小,且不能通用的缺陷,实现具有通用性的语音控制,适用范围广。本发明实施例提供一种语音识别控制系统,包括语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信 号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消 息,所述语音消息中携带所述语音信号对应的文本信息将所述语音消息发送至需要所述语 音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消 息中的文本信息控制所述应用单元的运行状态。本发明实施例提供一种语音识别控制方法,包括对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所 述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所 述语音消息中的文本信息控制应用单元的运行状态。本发明提供的语音识别控制系统和方法,通过语音消息中间件对语音输入设备输 入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该 消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运 行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根 据这些附图获得其他的附图。图1为本发明实施例一提供的语音识别控制系统的结构示意图;图2为本发明实施例二提供的语音识别控制系统的结构示意图;图3为本发明实施例三提供的语音识别控制方法的流程示意图;图4a为本发明实施例四提供的语音识别控制方法的流程示意图;图4b为本发明实施例四提供的语音识别控制方法的信令流程示意图;图5a为本发明实施例五提供的语音识别控制方法的流程示意图;图5b为本发明实施例五提供的语音识别控制方法中消息管理的信令流程示意 图;图5c为本发明实施例五提供的语音识别控制方法中消息通知的信令流程示意 图;图6a为本发明实施例六提供的语音识别控制方法中注册过程的流程示意图;图6b为本发明实施例六提供的语音识别控制方法中注册过程的信令流程示意 图;图6c本发明实施例六提供的语音识别控制方法中注销过程的流程示意图;图6d为本发明实施例六提供的语音识别控制方法中注销过程的信令流程示意 图;图6e为本发明实施例六提供的语音识别控制方法中状态控制的信令流程示意 图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例一图1为本发明实施例一提供的语音识别控制系统的结构示意图,如图1所示,该语 音识别控制系统包括语音输入设备15、语音消息中间件13和应用单元11。其中,语音输入设备15,用于对接收到的语音信号进行采样,得到语音信号;将所 述语音信号输入语音消息中间件;语音消息中间件13,用于对所述语音输入设备输入的语音信号进行识别得到语音 消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所 述语音消息的应用单元;应用单元11,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音 消息中的文本信息控制所述应用单元的运行状态。
具体地,语音消息中间件是一种可以运行在例如、电脑、手机、机顶盒等设备的操 作系统之上的服务性应用。语音消息是以语音作为输入源,通过特定的语音处理与识别处 理技术,将语音转换为可以识别和处理的信息。例如,用户以语音方式输入“关机”的语音 指令,通过语音消息中间件处理后,可以变成“关机”的文本指令或者其它应用可以识别和 处理的指令格式。其中,语音消息中至少包括识别出来的文本信息。文本信息也可以叫做 语音消息的消息内容,可以是精确的消息描述,也可以是模糊的消息描述。例如,“关机”的 语音输入的消息内容可以识别为“关机”的精确文本指令,也可以是“XX关机XX”等模糊文 本指令。由于语音识别经常具备模糊性,所以,语音消息中包含的消息内容可以支持模糊性 描述,各种应用单元可具备模糊性语音消息的处理能力。具体实现时,语音消息的内容可 以使用XML格式描述,也可以使用其它文本或二进制方式描述,可以根据实际需要确定。因 此,语音消息识别子系统识别语音信号时,根据消息特征库,可能将同一条语音信号识别出 一条或多条文本信息。在应用单元中可以包括文本消息特征库,应用单元处理文本信息的 方法具体可以包括以下情况情况一、如果语音消息中只包含单条文本信息,应用单元可以分离出语音消息中 的文本信息,将文本信息转换成执行指令。应用单元的消息处理模块检索和比对文本消息 特征库,将文本信息转换成执行指令。如果转换成功,则执行获取的执行指令。处理完成语 音消息后,删除语音消息。例如,语音上网应用单元获取到包含文本信息“搜索开机”的语音消息时,上网应 用分离出“搜索”执行指令,并将“开机”作为搜索的具体内容,此时,语音上网应用单元可 以直接启动上网功能并搜索“开机”相关的信息。但是,如果是开关机应用单元接收到包含 文本信息“搜索关机”的语音消息,则处理过程可以是开关机应用单元识别出其中包含“关 机”信息时,可以弹出对话框,提示用户是否确认“关机”,如果用户选择是,则开关机应用单 元生成关机指令并执行。再如,语音上网应用单元获取到仅包含文本信息“开机”的语音消息时,由于语音 上网应用单元未找到其支持的可以转化成执行指令的文本信息例如“搜索”等,则仅将“开 机”作为搜索的内容,但不执行搜索过程,直至下次再接收到包含“搜索”的语音消息时,才 执行搜索“开机”的过程;也可以将仅包含文本信息“开机”的语音消息丢弃或不处理。情况二、语音消息中包含多条文本信息时由于方言、环境不同,同一条语音信息可能被识别出多条文本信息。如果识别出多 条文本信息,则生成的语音消息中可以包括多条文本信息,并且根据消息特征库中语音特 征的相似度的大小,对识别出的多条文本信息排序,相似度越高的,排序越靠前。例如,语音语音上网应用单元获取到包含文本信息“搜索开机”、“搜搜开鸡”的语 音消息时,语音上网应用单元可以弹出对话框,提示用户选择是“搜索开机”还是“搜搜开 鸡”,根据用户的选择和确定输入的内容进行处理,如果用户选择“搜索开机”,则处理过程 与上述的情况一类似。由于在语音消息中,多条文本信息是有序的,所以,上网应用可以有 序的显示文本信息。此外,语音消息中还可以包括消息类型、消息产生时间、消息有效期等。其中,消 息类型可以有多种划分方法,例如可以将消息类型划分为持续型消息、突发型消息,其中, 持续型消息是持续的语音转换得到的消息,突发型消息则是间歇和/或突发的语音转换得到的消息。再如可以将消息类型划分为说话型、歌唱型等。消息类型也可以不进行设置或 者只设置一种,所有注册的应用单元,都可以获取该消息类型的语音消息,消息类型的具体 划分在本发明实施例中不做限制。如果设备中的应用单元需要获取语音消息,可先向语音消息中间件注册所需的消 息类型,当语音消息中间件在获取到相关类型的语音消息后,可以将相关类型的语音消息 推送给对应的应用单元,从而使应用单元可以根据语音输入和识别的结果完成控制过程。 语音消息中间件可向设备的应用层的所有应用单元提供语音消息的处理和传送服务。一个 应用单元同时可以注册多个消息获取请求。以语音上网应用单元为例将语音上网应用单 元划分为服务发现模块、消息处理模块和第一应用注册模块。用户将语音上网应用单元启 动后,该语音上网应用单元的服务发现模块在系统中查找语音消息中间件是否运行,如果 未运行,则可运行该语音消息中间件。其中,语音消息中间件也可以默认为在系统启动后自 动运行,但在没有应用单元需要语音消息时,不启动该语音消息中间件的语音获取与识别 功能,即不启动语音获取模块、语音处理模块与语音识别模块等与语音获取与识别功能有 关的模块。在语音上网应用单元启动并查找到语音消息中间件后,调用自身的消息第一应 用注册模块向语音消息中间件注册所需的消息类型。语音消息中间件接收到相关请求后, 启动语音消息获取与识别功能,并将获取到的该语音上网应用单元所需的语音消息递送给 语音上网应用单元。语音上网应用单元获取语音消息后,分离出语音消息中的文本指令例 如“上网”,启动上网功能,查找匹配的网站和网络内容。本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携 带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以 将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用 性,可以适用于各种功能的应用单元。实施例二图2为本发明实施例二提供的语音识别控制系统的结构示意图,如图2所示,在实 施例一的基础上该语音识别控制系统的语音消息中间件13可以包括语音消息识别子系 统21和语音消息通知子系统23。其中,语音消息识别子系统21,用于对所述语音输入设备输入的语音信号进行处 理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的 特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息生成携带所述文 本信息的语音消息,所述语音消息还包括消息类型,将所述语音消息发送至语音消息通知 子系统;语音消息通知子系统23,用于提取所述语音消息的消息类型,查询是否存在需要 该消息类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用 单元发送所述语音消息。进一步地,语音消息识别子系统21可以包括语音处理模块210、语音识别模块 211、消息特征库212、第一消息通知模块213和第一服务控制模块214 ;其中,语音处理模块210,用于对所述语音输入设备输入的语音信号进行处理;语音识别模块211,用于提取所述语音信号的特征码,根据消息特征库212中预先 存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带消息类型和所述文本信息的语音消息;消息特征库212,用于保存匹配所用的特征码;第一消息通知模块213,用于向所述语音消息通知子系统23发送所述语音消息;第一服务控制模块214,用于根据所述语音消息通知子系统23的指示控制所述语 音消息识别子系统21的运行状态。此外,语音消息识别子系统21还可以包括语音获取模块215和第一服务交互接 Π 216 ;其中,语音获取模块215,用于接收所述语音输入设备输入的所述语音信号,将所 述语音信号预处理后发送至所述语音处理模块210 ;第一服务交互接口 216,用于将所述第一消息通知模块发送的所述语音消息转发 至所述语音消息通知子系统23的第二服务交互接口 ;其中,所述第一服务控制模块214,还用于控制所述语音处理模块210、语音识别 模块211、消息特征库212、第一消息通知模块213、语音获取模块215和第一服务交互接口 216之间的交互。具体地,设备的操作系统(硬件)层的语音输入设备向语音获取模块215提供语 音信号。语音处理模块210启动后,通知语音获取模块215从语音输入设备中获取语音信 息,相关语音信息通过语音处理模块210预处理后,送给语音识别模块。语音输入设备输入 的语音信号可以是连续的,语音获取模块215可以同时接收多路语音输入设备,语音获取 模块215可以从一个或多个语音输入设备获取语音信号,一边获取一边处理。语音获取模 块215还可以设置语音输入设备的运行参数和运行状态。其中,运行参数主要包括语音采 样率和输入格式,运行状态主要包括启动、停止、暂停等。语音处理模块210接收并处理语 音获取模块215传送的每一路语音信号,如果存在多路语音信号,语音处理模块210还可以 将多路语音信号按一定规则合成为单路语音信号。输入的各路语音信号存在一定的属性, 主要包括语音的正负向属性,其中,正负向属性是指如果语音信号是需要识别的关键信 息,则约定为正向,否则,约定为负向。负向语音信号通常用于采集背景声音,背景声音通常 不用于识别,而用于信号去噪。语音处理模块210将处理后的语音信号推送给语音识别模 块211。语音处理模块210连续分块地向语音识别模块211推送语音信号。语音识别模块 211接收和处理来自语音处理模块210的语音信号,检查和匹配语音信号,将语音信号转换 成语音消息。语音识别模块211将生成的语音消息推送给第一消息通知模块213。语音识 别模块211提取语音信号的特征码,并通过消息特征库212模块检查和匹配预存储的特征 码,如果找到相同的或相似的特征码,则可认为找到匹配的语音消息。可以根据需要选用的 语音识别算法,以检查和匹配特征码,并生成语音消息。匹配时,可以使用模糊算法。消息 特征库212可以保存一些可以识别的语音消息的特征码,从而向语音识别模块211提供语 音消息特征码的检查和匹配服务。语音识别模块211生成的语音消息通过第一消息通知模 块213和第一服务交互接口 216传送给语音消息通知子系统。第一服务交互接口 216提供 接口,与语音消息通知子系统交互。第一服务控制模块214是语音消息识别子系统的控制 中心。第一服务控制模块214可以启动、关闭、暂停语音获取模块等各个模块的运行状态。 其它各个模块通过第一服务控制模块214相互交互。再进一步地,语音消息通知子系统23包括消息管理模块231、应用管理模块232、第二消息通知模块233和第二服务控制模块234。其中,消息管理模块231,用于将各个语音消息保存为一个消息队列;定期检查所 述消息队列中当前是否存在需要发送的语音消息,若存在需要发送的语音消息,则提取所 述语音消息的消息类型,指示应用管理模块232查询是否存在需要该消息类型的语音消息 的应用单元,若存在,则指示第二消息通知模块233向需要该消息类型的语音消息的应用 单元发送所述语音消息;应用管理模块232,用于查询是否存在需要该消息类型的语音消息的应用单元; 若存在,则所述消息管理模块231返回所述需要该消息类型的语音消息的应用单元的信 息;第二消息通知模块233,用于根据所述消息管理模块231的指示,向需要该消息类 型的语音消息的应用单元发送所述语音消息;第二服务控制模块234,用于指示所述语音消息识别子系统21需要控制的运行状 态。此外,语音消息通知子系统23还可以包括应用交互接口 235、第一应用注册模块 236和第二服务交互接口 237。其中,应用交互接口 235,用于将所述第二消息通知模块233的所述语音消息转发 至需要该消息类型的语音消息的应用单元;将接收的所述应用单元发送的语音消息获取请 求的注册或注销信息发送至第一应用注册模块236 ;第一应用注册模块236,用于根据所述应用单元的语音消息获取请求的注册或注 销信息,对所述应用单元的语音识别控制功能进行注册或注销;第二服务交互接口 237,用于接收所述语音消息识别子系统的第一服务交互接口 216发送的所述语音消息;其中,第二服务控制模块234,还用于控制所述应用管理模块232、消息管理模块 231、第二消息通知模块233、应用交互接口 235、第一应用注册模块236和第二服务交互接 口 237之间的交互。再进一步地,语音消息通知子系统23还可以包括服务注册模块和配置管理模 块,其中,服务注册模块,用于在所述语音消息通知子系统启动时,根据设定规则注册所述 语音消息通知子系统的运行状态;配置管理模块,用于对所述语音消息通知子系统的运行 参数进行配置管理。第二服务控制模块234,还可以控制服务注册模块、配置管理模块与语 音消息通知子系统的其他各个子模块之间的交互。具体地,不同设备的应用层可以包括不同的应用单元,例如,桌面管理应用、浏览 器应用、播放器应用等。语音消息通知子系统23的应用交互接口 235为应用单元提供约 定接口,应用层的应用单元通过应用交互接口 235与语音消息通知子系统23交互。如图2 所示,每个应用单元11可以包括服务发现模块31、消息处理模块32和第二应用注册模块 33,这三个模块可以分别通过语音消息通知子系统23的应用交互接口 235的服务发现接 口、消息通知接口、应用注册接口与语音消息通知子系统23交互。通过应用注册接口,应用 单元的第二应用注册模块33可以向语音消息通知子系统23发送语音消息获取请求的注册 和/或注销信息;通过消息通知接口,应用单元的消息处理模块32可以接收到所需的语音 消息;通过服务发现接口,应用单元的服务发现模块31可以查找到当前正在运行的语音消息通知子系统23。应用单元还可以包括其他与其应用功能相对应的模块,在此不做限制。第一应用注册模块236通过应用交互接口 235接收和处理应用单元的语音消息获 取请求的注册和/或注销信息后,与应用管理模块232协同管理应用单元的语音消息获取 请求注册和/或注销信息。当应用单元需要接收某类型的语音消息时,向语音消息中间件 发送语音消息获取请求的注册信息,语音消息获取请求的注册信息内容可以主要包括应 用类型、应用标识、需要获取的消息类型及参数、消息获取接口等。其中,应用标识、消息类 型、消息参数、消息获取接口合称为四元组信息,一个四元组信息唯一确定一个语音消息获 取请求及其相关消息。其中,应用标识为唯一确定该应用单元的标识信息;消息类型可以 参见实施例一中的描述,不同的应用单元可以对应不同或相同的消息类型;消息参数为指 标识应用在运行状态下的唯一性标识值,例如,应用在进程中的进程标识值,可以作为指示 应用单元自身的上下文指针,方便查找该应用单元;消息获取接口为应用单元用于接收或 提取语音消息的函数指针,语音消息中间件调用该消息获取接口可以将语音消息推送给应 用单元,在调用该消息获取接口时,可以将消息参数一并返回给应用单元。如果应用单元注 册成功,则第一应用注册模块236向应用单元反馈与四元组信息唯一对应的消息接收标识 码;否则,通知应用单元注册失败。此外,应用单元可以删除某个语音消息获取请求,在删除 过程中,需要包括第一应用注册模块236反馈的消息接收标识码以及对应的四元组信息。 当删除成功时,消息接收标识码失效。如果应用提供的消息接收标识码和对应的四元组信 息不正确,或者失效,则第一应用注册模块236可以拒绝相关请求。应用管理模块232管理已经注册的应用单元及其语音消息获取请求的相关消息。 当存在需要通知的语音消息时,消息管理模块231可以通过应用管理模块232查找需要通 知的语音消息的应用单元的信息。应用管理模块232根据第一应用注册模块236的请求,创 建、保存、修改或删除指定的应用单元的语音消息获取请求的相关信息(包括消息接收标 识码和四元组信息),消息接收标识码可由应用管理模块232创建,也可由其它模块创建。此外,消息管理模块231管理来自语音消息识别子系统的语音消息,消息管理模 块231以消息队列的方式管理语音消息。消息管理模块231获取到语音消息后,提取语音 消息的消息类型,通过应用管理模块232查找并匹配需要指定语音消息类型的应用,找到 应用后,通过第二消息通知模块233向应用提供语音消息。第二消息通知模块233向所有 需要约定消息类型的应用提供语音消息。语音消息处理完后,在约定条件下,第二消息通知 模块233可以删除相关语音消息。第二消息通知模块233根据消息管理模块231的要求, 通过应用交互接口 235向应用推送指定语音消息,或者通知应用单元提取指定语音消息。 第二消息通知模块233调用应用的消息获取请求四元组信息的消息获取接口,通知应用接 收和/或提取语音消息。服务注册模块在语音消息通知子系统启动时,以某种规则注册语 音消息通知子系统的运行状态。应用的服务发现模块可以根据该规则找到运行中的语音消 息通知子系统。实施例可以自定义所述规则。常用的规则有,共享内存、共享信号量等。配 置管理模块用于对所述语音消息通知子系统的运行参数进行配置管理。第二服务交互接口 237提供接口,与语音消息识别子系统交互。第二服务控制模块234是语音消息通知子系 统的控制中心。第二服务控制模块234可以启动、关闭、暂停语音消息识别子系统的运行状 态。其它模块通过第二服务控制模块234相互交互。本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以 将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用 性,可以适用于各种功能的应用单元。实施例三图3为本发明实施例三提供的语音识别控制方法的流程示意图,如图3所示,该语 音识别控制方法包括步骤101、对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息 中携带所述语音信号对应的文本信息;步骤102、将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单 元根据所述语音消息中的文本信息控制应用单元的运行状态。具体地,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统 完成,语音识别控制系统中,语音消息中间件的语音消息识别子系统对语音输入设备输入 的语音信号进行识别得到语音消息后,语音消息通知子系统检查需要所述语音消息的应用 单元,若存在,则将语音消息发送至应用单元,以使应用单元根据语音消息控制应用单元的 运行状态。其中,语音消息中除了可以包括文本信息外,还可以包括消息类型、消息产生时 间、消息有效期等,具体可以参见实施例一中的相关描述。本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携 带文本信息的语音消息后,若存在需要该语音消息的应用单元,则可以将该语音消息发送 至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种 功能的应用单元。实施例四图4a为本发明实施例四提供的语音识别控制方法的流程示意图,如图4所示,在 实施例三的基础上,该语音识别控制方法的步骤101可以包括步骤201、对所述语音输入设备输入的语音信号进行处理;步骤202、提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所 述语音信号的特征码进行匹配;步骤203、若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带所述 文本信息的语音消息,所述语音消息还包括消息类型。其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完 成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图4b 所示,为本发明实施例四提供的语音识别控制方法的信令流程示意图,其中,上述步骤101 对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信 号对应的文本信息,具体方法可以包括步骤301、语音消息识别子系统的语音获取模块从语音输入设备的语音采集模块 获取语音信号。如果语音获取模块启动接收语音信号,则语音输入设备可以不间断地向语 音获取模块传送语音信号,直至语音获取模块中止相关接收过程。步骤302、语音获取模块将获取的各路语音信号进行量化、去噪等预处理,将预处 理的语音信号推送给语音处理模块。上述的步骤301至步骤302是语音获取与预处理流程。步骤302中将预处理后的语音信号推送给语音处理模块的过程,可以是同步或异步操作过程,既可以实时推送,也可 以每隔一段时间推送一定数据量的语音信号。语音获取模块还可以设置语音输入设备的运 行参数和运行状态。其中,运行参数主要包括语音采样率和输入格式,运行状态包括启动、 停止、暂停等。此外,语音获取模块还可以向对应的语音输入设备反馈语音信号的接收状 态。步骤303、语音处理模块对语音获取模块传送的各路语音信号优化处理,推送给语 音识别模块。例如如果存在多路语音信号,可以将多路语音信号按一定规则合成为单路语 音信号。上述步骤302中预处理语音信号的过程也可以由语音处理模块完成,预处理的过 程也可以归属于对语音信号进行优化处理的过程中。步骤304、语音处理模块可以将优化处理后的语音信号连续分块地向语音识别模 块推送语音信号。步骤304可以是同步或异步的过程。上述的步骤303和步骤304为语音优化处理的过程。步骤305、语音识别模块接收到来自语音处理模块的语音信号后,对语音信号进行 识别,得到文本信息,具体方法是语音识别模块提取语音信号的特征码,查找消息特征库 中预先存储的特征码,如果在消息特征库中预先存储的特征码中查找到与语音信号的特征 码相同或相似的特征码,则匹配成功,获取该语音信号的特征码对应的文本信息。步骤306、语音识别模块将识别出的文本信息推送给第一消息通知模块。上述的步骤305和步骤306为语音识别的过程,可以将语音信号识别成文本信息。步骤307、第一消息通知模块将接收到的文本信息封装成应用单元可以识别的语 音消息,封装后的语音消息中携带消息类型和文本信息。步骤308、语音消息识别子系统的第一消息通知模块将携带消息类型和文本信息 的语音消息发送给语音消息识别子系统的第一服务交互接口,然后该语音消息识别子系统 第一的服务交互接口将该语音消息推送给语音消息通知子系统的第二服务交互接口。上述的步骤307到步骤308是语音消息通知的过程,可以将携带消息类型和文本 信息的语音消息推送给语音消息通知子系统。本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携 带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以 将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用 性,可以适用于各种功能的应用单元。实施例五图5a为本发明实施例五提供的语音识别控制方法的流程示意图,如图5所示,在 实施例三、四的基础上,该语音识别控制方法的步骤102可以包括步骤401、将各个语音消息保存为一个消息队列;步骤402、定期检查所述消息队列中当前是否存在需要发送的语音消息。步骤403、若存在需要发送的语音消息,则提取所述语音消息的消息类型,查询是 否存在需要该消息类型的语音消息的应用单元;步骤404、若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音 消息。其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图5b 所示,为本发明实施例五提供的语音识别控制方法中消息管理的信令流程示意图,其中,语 音消息中间件的语音消息通知子系统的各个模块获取并管理语音消息识别子系统发送的 语音消息的主要处理流程可以包括步骤501、语音消息通知子系统的第二服务交互接口接收语音消息识别子系统的 第一服务交互接口发送的携带消息类型和文本信息的语音消息。该步骤可以接着上一实施 例中的步骤308。步骤502、语音消息通知子系统的第二服务交互接口将携带消息类型和文本信息 的语音消息推送给消息管理模块。步骤503、消息管理模块提取语音消息的消息类型后,指示应用管理模块进行收方 检查,即检查是否有应用单元需要该消息类型的语音消息。步骤504、应用管理模块查询是否有应用需要指定消息类型的语音消息,如果存在 有应用需要指定消息类型的语音消息,则向消息管理模块返回成功的检查结果,执行步骤 507 ;否则,向消息管理模块返回失败的检查结果后执行步骤505。步骤505、如果没有应用单元需要指定消息类型的语音消息,消息管理模块将无主 语音消息的相关信息如语音消息的消息类型、无应用单元需要的状态等,推送给第二服务 控制模块,以获取的无主语音消息的处理方法。其中,本实施例中的无主语音消息是指没有 应用单元注册需要的指定消息类型的语音消息。步骤506、第二服务控制模块返回无主语音消息的处理方法。例如如果第二服务 控制模块要求保留相关的无主语音消息,则转至步骤507,否则,消息管理模块抛弃相关的 无主语音消息,并转至步骤508。其中,上述步骤503-506的查询过程是可选步骤,也可以不执行步骤503-506,而 执行步骤502之后,直接执行步骤507。步骤507、消息管理模块存储相关语音消息。步骤508、消息管理模块向第二服务交互接口反馈语音消息的处理结果,例如正 常处理,未处理等。步骤509、语音消息通知子系统的第二服务交互接口将语音消息的处理结果反馈 给语音消息识别子系统的第一服务交互接口。然后语音消息识别子系统的第一服务交互接 口可以将语音消息的处理结果反馈给语音消息识别子系统的第一消息通知模块。如图5c所示,为本发明实施例五提供的语音识别控制方法中消息通知的信令流 程示意图,其中,若存在需要所述消息类型的应用单元,则语音消息通知子系统的各个模块 将所述语音消息发送至所述应用单元的具体过程可以包括步骤601、消息管理模块定期检查消息队列中是否存在需要发送的语音消息。如果 存在,则执行步骤602 ;如果不存在,则继续定期检查。步骤602、消息管理模块通过应用管理模块查询是否存在需要接收某一消息类型 (步骤601中查找到的需要发送的某一条语音消息的消息类型)的应用单元。步骤603、应用管理模块将查询结果返回给消息管理模块。如果应用管理模块没有 查到需要接收该消息类型的应用单元,则消息管理模块可以删除这一条语音消息,并转回 步骤601,继续处理下一条语音消息。如果查到存在需要该消息类型的应用单元,则执行步骤 604。步骤604、消息管理模块通过第二消息通知模块,向查找到需要该消息类型的应用 单元推送该语音消息。步骤605、第二消息通知模块将该语音消息推送给应用交互接口。步骤606、应用交互接口向应用单元推送该语音消息。步骤607、应用单元的消息处理模块接收到该语音消息后,向应用交互接口反馈处
理结果。步骤608、应用交互接口将应用单元的语音消息处理结果反馈给第二消息通知模 块。步骤609、第二消息通知模块将语音消息处理结果反馈给消息管理模块。如果一条语音消息有多个接收应用单元,则可以重复执行步骤604至步骤609,依 次或同时向每个应用单元推送某一消息类型的语音消息。此外,消息管理模块在处理完某条语音消息后,可以删除该条语音消息相关的信 肩、ο本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携 带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以 将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用 性,可以适用于各种功能的应用单元。实施例六在实施例三、四、五的基础上,本发明实施例六提供的语音识别控制方法,在进行 语音识别之前或者过程中还可以包括注册过程和/或注销过程。其中,如图6a所示,为本发明实施例六提供的语音识别控制方法中注册过程的流 程示意图,注册过程为根据所述应用单元的语音消息获取请求的注册信息,对所述应用单 元的语音识别控制功能进行注册,具体可以包括步骤701、接收应用单元的语音消息获取请求的注册信息,所述注册信息中包括所 述应用单元的注册所需的四元组信息,所述四元组信息包括应用标识、消息类型、消息参数 和消息获取接口;步骤702、若所述注册信息有效,根据所述四元组信息,查询所述应用单元的语音 识别控制功能是否已经注册;步骤703、如果未注册,则存储所述应用单元的四元组信息,根据所述四元组信息 生成对应的消息接收标识码,并向所述应用单元返回携带所述消息接收标识码的注册成功 结果。由于消息接收标识码与该应用单元的四元组信息对应,通过该消息接收标识码可以 快速查找到该应用单元的四元组信息,从而加快注册速度,并对在后续需要对应用单元进 行注销时,加快注销速度。其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完 成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图6b 所示,为本发明实施例六提供的语音识别控制方法中注册过程的信令流程示意图,其中,语 音消息中间件的语音消息通知子系统的各个模块根据应用单元的语音消息获取请求的注 册信息,对应用单元的语音识别控制功能进行注册的具体过程如下
步骤801、语音消息通知子系统的应用交互接口接收应用单元的语音消息获取请 求的注册信息,其中,注册信息包括应用类型、应用标识、消息获取接口、消息类型、消息参 数等,其中,应用标识、消息类型、消息参数和消息获取接口为该注册信息的四元组信息。步骤802、语音消息通知子系统的应用交互接口对应用单元的语音消息获取请求 的注册信息进行预处理,并将相关的注册信息转发给语音消息通知子系统的第一应用注册 模块。步骤803、第一应用注册模块将注册信息发送给应用管理模块,指示应用管理模块 查询应用单元的语音识别控制功能是否已经注册。其中,第一应用注册模块还可以检查应 用单元通过语音消息获取请求的注册信息提供的注册信息是否符合约定的规则,如果符合 约定的规则,则有效,如果不符合约定的规则,则直接转至步骤806直接返回处理结果。步骤804、应用管理模块检查该应用单元的注册信息是否已经存在,如果应用单元 的注册信息已经存在,表明该应用单元的语音识别控制功能已经注册,则转到步骤805,反 馈注册结果。如果未注册,则存储该应用单元的注册信息(包括四元组信息),并生成消息 接收标识码,通过步骤805返回注册结果。此外,如果该应用单元的语音消息获取请求的注 册信息是第一个有效请求,则应用管理模块可以通知语音消息通知子系统的第二服务控制 模块,有应用单元要获取语音消息,语音消息通知子系统的第二服务控制模块可以检查并 启动语音消息识别子系统。步骤805、应用管理模块向语音消息通知子系统的第一应用注册模块反馈应用单 元的注册信息的处理结果,例如处理成功、失败或未处理。步骤806、语音消息通知子系统的第一应用注册模块将处理结果反馈给语音消息 通知子系统的应用交互接口。步骤807、语音消息通知子系统的应用交互接口将处理结果反馈给应用单元的第 二应用注册模块。其中,语音消息通知子系统的第一应用注册模块通过应用交互接口向应用单元反 馈的注册结果可以包括注册的状态如成功或失败;语音消息获取请求的注册信息处理失 败原因如四元组信息不对;注册成功时返回消息接收标识码等。应用单元根据语音消息通知子系统的第一应用注册模块的反馈结果做后继处理。 如果注册成功,则应用单元需要保存反馈的消息接收标识码。注册成功后,应用单元通过注 册的消息获取接口获取通知消息。其中,如图6c所示,本发明实施例六提供的语音识别控制方法中注销过程的流程 示意图,注销过程为根据所述应用单元的语音消息获取请求的注销信息,对所述应用单元 的语音识别控制功能进行注销,具体可以包括步骤901、接收应用单元的发送的语音消息获取请求的注销信息,所述注销信息包 括已经注册的消息接收标识码和四元组信息;步骤902、若所述消息接收标识码和所述四元组信息正确,则删除所述消息接收标 识码和所述四元组信息,以使所述消息接收标识码失效。其中,如果仅存在该已注销的应用 单元需要的某一消息类型的语音消息,则可以删除该消息类型的语音消息;如果存在多个 应用单元需要相同的消息类型的语音消息,则可以逐个检查是否还有需要该消息类型的应 用单元,如果没有,则可以删除该消息类型的语音消息。在消息队列为空时,则语音消息通知子系统可以通知语音消息识别子系统停止语音消息的获取与识别过程。如图6d所示,为本发明实施例六提供的语音识别控制方法中注销过程的信令流 程示意图,其中,对于已经向语音消息通知子系统成功注册过的应用单元,语音消息中间件 的语音消息通知子系统的各个模块可以根据应用单元的语音消息获取请求的注销信息,对 应用单元的语音识别控制功能进行注销,注销时,应用单元需要提供注册时生成的相应的 消息接收标识码及与该消息接收标识码对应的四元组信息,具体过程如下步骤111、应用单元的第二应用注册模块向语音消息通知子系统的应用交互接口 发送语音消息获取请求的注销信息。注销信息的内容主要包括,消息接收标识码、该消息接 收标识码对应的四元组。步骤112、语音消息通知子系统的应用交互接口将应用的语音消息获取请求的注 销信息转发给语音消息通知子系统的第一应用注册模块。步骤113、语音消息通知子系统的第一应用注册模块通过语音消息通知子系统的 应用管理模块检查应用单元的注销信息中的请求类型等四元组信息是否完整,以及消息接 收标识码是否存在和有效。如果四元组信息不完整,或者消息接收标识码不存在,则直接转 至步骤115,通知语音消息获取请求的注销信息失败;否则,执行步骤114。步骤114、如果应用单元提交的消息接收标识码及对应的四元组信息存在且有效, 应用管理模块检查是否还有应用单元需要接收语音消息。如果没有应用单元需要接收语音 消息,则应用管理模块通知第二服务控制模块无应用需要获取语音消息,此时,语音消息通 知子系统的第二服务控制模块可以通知语音消息识别子系统停止语音的获取与识别过程。步骤115、语音消息通知子系统的应用管理模块将注销信息的处理结果反馈给语 音消息通知子系统的第一应用注册模块。步骤116、语音消息通知子系统的第一应用注册模块将处理结果反馈给语音消息 通知子系统的应用交互接口。步骤117、语音消息通知子系统的应用交互接口将语音消息获取请求的注销信息 的处理结果反馈给应用单元的第二应用注册模块。语音消息通知子系统向应用单元反馈的 处理结果可以包括应用单元的语音消息获取请求的注销信息的处理状态如成功或失败; 请求处理失败原因如四元组信息不对等。如果语音消息获取请求的注销信息处理成功,则 其对应的消息接收标识码失效。如图6e所示,为本发明实施例六提供的语音识别控制方法中状态控制的信令流 程示意图,其中,语音服务中间件的语音消息通知子系统和语音消息识别子系统的状态控 制过程可以包括步骤121、语音消息通知子系统的应用管理模块检查是否有应用单元需要获取语 音消息。步骤122、如果语音消息通知子系统的应用管理模块检查到有应用单元需要获取 语音消息,则通知语音消息通知子系统的第二服务控制模块检查和控制语音消息识别子系 统的运行状态。例如语音消息通知子系统的应用管理模块在处理应用单元的语音消息获取请求 的注册或注销信息时,检查当前是否有应用单元需要获取语音消息,如果有,则通知语音消 息通知子系统的第二服务控制模块启动语音消息识别子系统;如果没有,则通知语音消息通知子系统的第二服务控制模块可以关闭语音消息识别子系统。步骤123、语音消息通知子系统的第二服务控制模块指示语音消息通知子系统的 第二服务交互接口,检查语音消息识别子系统的运行状态。其中,语音消息识别子系统的运 行状态主要包括语音消息识别子系统是否启动、语音获取模块、语音处理模块及语音识别 模块等是否正常工作。步骤124、语音消息通知子系统的第二服务交互接口检查语音消息识别子系统是 否启动,如果启动,则执行步骤125 ;如果未启动,则执行步骤128。步骤125、语音消息通知子系统的第二服务交互接口通过语音消息识别子系统的 第一服务交互接口,向语音消息识别子系统的第一服务控制模块发送当前的状态获取请 求。步骤126、语音消息识别子系统的第一服务控制模块检查语音消息识别子系统的 当前状态,并将该当前状态返回给语音消息识别子系统的第一服务交互接口。步骤127、语音消息识别子系统的第一服务交互接口将获取到的语音消息识别子 系统的当前状态反馈给语音消息通知子系统的第二服务交互接口。步骤128、语音消息通知子系统的第二服务交互接口将获取到的语音消息识别子 系统的当前状态转发给语音消息通知子系统的第二服务控制模块。其中,如果是未启动,则 返回语音消息识别子系统未启动的运行状态,如果已经启动,则返回语音消息识别子系统 各个子模块的当前状态。上述的步骤123至步骤128是语音消息识别子系统的运行状态查询流程。通过步 骤123到步骤128、语音消息通知子系统的第二服务控制模块可以实时或周期性的获知语 音消息识别子系统的当前状态。步骤129、如果语音消息通知子系统的第二服务控制模块检查到有应用需要获取 语音消息,且语音消息识别子系统未启动,则语音消息通知子系统的第二服务控制模块启 动语音消息识别子系统,然后,执行步骤123至步骤128检查语音消息识别子系统的当前状 态。如果语音消息通知子系统的第二服务控制模块接收到的状态为语音消息识别子系统已 经启动,且获取了语音消息识别子系统的当前状态,例如启动或暂停语音消息获取、处理 或识别过程等,则执行步骤130。此外,如果语音消息通知子系统的第二服务控制模块接收到的状态为语音消息识 别子系统已经启动,但是无应用单元需要获取语音消息,则可以转至步骤138,关闭语音消 息识别子系统。步骤130、语音消息通知子系统的第二服务控制模块将语音消息识别子系统的当 前状态发送给语音消息通知子系统的第二服务交互接口。步骤131、语音消息通知子系统的第二服务交互接口将语音消息识别子系统的当 前状态发送给语音消息识别子系统的第一服务交互接口。步骤132、语音消息识别子系统的第一服务交互接口将语音消息识别子系统的当 前状态发送给语音消息识别子系统的第一服务控制模块。步骤133、语音消息识别子系统的第一服务控制模块根据接收到的当前状态,控制 语音消息识别子系统的各个模块例如语音获取模块的状态调整。步骤134、语音消息识别子系统的语音获取模块根据接收到的当前状态调整自己的状态后,向语音消息识别子系统的第一服务控制模块反馈调整结果,将最新的运行状态 反馈给语音消息识别子系统的第一服务控制模块。语音消息识别子系统的第一服务控制模块可以按照与上述步骤133和步骤134类 似的方法及相关的控制状态,控制其它模块例如,语音处理模块、语音识别模块等的运行状 态。步骤135、语音消息识别子系统的第一服务控制模块收集各个模块的当前状态,并 将收集的各个模块的当前状态反馈给语音消息识别子系统的第一服务交互接口。步骤136、语音消息识别子系统的第一服务交互接口将语音消息识别子系统各个 模块的当前状态反馈给语音消息通知子系统的第二服务交互接口。步骤137、语音消息通知子系统的第二服务交互接口将语音消息识别子系统各个 模块的当前状态反馈给语音消息通知子系统的第二服务控制模块。其中,步骤130至步骤137是语音消息识别子系统各个模块的运行状态控制流程。 通过步骤130至步骤137,语音消息通知子系统的第二服务控制模块可以控制语音消息识 别子系统的运行状态。步骤138、语音消息通知子系统的第二服务控制模块关闭语音消息识别子系统。然 后,如果有检查到有应用单元需要获取语音消息,再通过步骤123至步骤128检查语音消息 识别子系统的运行状态。本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携 带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以 将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用 性,可以适用于各种功能的应用单元。本发明上述实施例中通过语音服务中间件实现本发明语音识别控制方法的过程 仅为示例,对语音服务中间件的结构的划分也可以采用其他实现方式,例如将语音消息通 知子系统与语音消息识别子系统作为一个系统划分功能模块,或者改变这两个子系统的功 能模块名称及相互关系。本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过 程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序 在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括R0M、RAM、磁碟或光 等各种可以存储程序代码的介质。最后应说明的是以上实施例仅用以说明本发明的技术方案,而非对其限制;尽 管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解其依然 可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替 换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精 神和范围。
权利要求
1.一种语音识别控制系统,其特征在于,包括语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输 入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息, 所述语音消息中携带所述语音信号对应的文本信息,将所述语音消息发送至需要所述语音 消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中 的文本信息控制所述应用单元的运行状态。
2.根据权利要求1所述的语音识别控制系统,其特征在于,所述语音消息中间件包括 语音消息识别子系统,用于对所述语音输入设备输入的语音信号进行处理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹 配;若匹配成功,根据该语音信号的特征码对应的文本信息生成携带所述文本信息的语音 消息,所述语音消息还包括消息类型,将所述语音消息发送至语音消息通知子系统;语音消息通知子系统,用于提取所述语音消息的消息类型,查询是否存在需要该消息 类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用单元发 送所述语音消息。
3.根据权利要求2所述的语音识别控制系统,其特征在于,所述语音消息识别子系统 包括语音处理模块,用于对所述语音输入设备输入的语音信号进行处理; 语音识别模块,用于提取所述语音信号的特征码,根据消息特征库中预先存储的特征 码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本 信息,生成携带消息类型和所述文本信息的语音消息; 消息特征库,用于保存匹配所用的特征码;第一消息通知模块,用于向所述语音消息通知子系统发送所述语音消息; 第一服务控制模块,用于根据所述语音消息通知子系统的指示控制所述语音消息识别 子系统的运行状态。
4.根据权利要求3所述的语音识别控制系统,其特征在于,所述语音消息识别子系统 还包括语音获取模块,用于接收所述语音输入设备输入的所述语音信号,将所述语音信号预 处理后发送至所述语音处理模块;第一服务交互接口,用于将所述第一消息通知模块发送的所述语音消息转发至所述语 音消息通知子系统的第二服务交互接口;所述第一服务控制模块,还用于控制所述语音处理模块、语音识别模块、第一消息通知 模块、语音获取模块和第一服务交互接口之间的交互。
5.根据权利要求2-4任一所述的语音识别控制系统,其特征在于,所述语音消息通知 子系统包括消息管理模块,用于将各个语音消息保存为一个消息队列;定期检查所述消息队列中 当前是否存在需要发送的语音消息,若存在需要发送的语音消息,则提取所述语音消息的 消息类型,指示应用管理模块查询是否存在需要该消息类型的语音消息的应用单元,若存在,则指示第二消息通知模块向需要该消息类型的语音消息的应用单元发送所述语音消 息;应用管理模块,用于查询是否存在需要该消息类型的语音消息的应用单元;若存在,则 所述消息管理模块返回所述需要该消息类型的语音消息的应用单元的信息;第二消息通知模块,用于根据所述消息管理模块的指示,向需要该消息类型的语音消 息的应用单元发送所述语音消息;第二服务控制模块,用于指示所述语音消息识别子系统需要控制的运行状态。
6.根据权利要求5所述的语音识别控制系统,其特征在于,所述语音消息通知子系统 还包括应用交互接口,用于将所述第二消息通知模块的所述语音消息转发至需要该消息类型 的语音消息的应用单元;将接收的所述应用单元发送的语音消息获取请求的注册或注销信 息发送至第一应用注册模块;第一应用注册模块,用于根据所述应用单元的语音消息获取请求的注册或注销信息, 对所述应用单元的语音识别控制功能进行注册或注销;第二服务交互接口,用于接收所述语音消息识别子系统的第一服务交互接口发送的所 述语音消息;所述第二服务控制模块,还用于控制所述应用管理模块、消息管理模块、第二消息通知 模块、应用交互接口、第一应用注册模块和第二服务交互接口之间的交互。
7.一种语音识别控制方法,其特征在于,包括对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语 音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所述语 音消息中的文本信息控制应用单元的运行状态。
8.根据权利要求7所述的语音识别控制方法,其特征在于,所述对语音输入设备输入 的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息, 包括对所述语音输入设备输入的语音信号进行处理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的 特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带所述文本信息的语 音消息,所述语音消息还包括消息类型。
9.根据权利要求8所述的语音识别控制方法,其特征在于,所述将所述语音消息发送 至需要所述语音消息的应用单元,包括若存在需要发送的语音消息,则提取所述语音消息的消息类型,查询是否存在需要该 消息类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
10.根据权利要求9所述的语音识别控制方法,其特征在于,所述提取所述语音消息的 消息类型之前,包括将各个语音消息保存为一个消息队列;定期检查所述消息队列中当前是否存在需要发送的语音消息。
11.根据权利要求9或10所述的语音识别控制方法,其特征在于,还包括根据所述应用单元的语音消息获取请求的注册信息,对所述应用单元的语音识别控制 功能进行注册;或根据所述应用单元的语音消息获取请求的注销信息,对所述应用单元的语音识别控制 功能进行注销。
12.根据权利要求11所述的语音识别控制方法,其特征在于,所述根据所述应用单元 的语音消息获取请求的注册信息,对所述应用单元的语音识别控制功能进行注册,包括接收应用单元的语音消息获取请求的注册信息,所述注册信息中包括所述应用单元的 注册所需的四元组信息,所述四元组信息包括应用标识、消息类型、消息参数和消息获取接 Π ;若所述注册信息有效,根据所述四元组信息,查询所述应用单元的语音识别控制功能 是否已经注册;如果未注册,则存储所述应用单元的四元组信息,根据所述四元组信息生成对应的消 息接收标识码,并向所述应用单元返回携带所述消息接收标识码的注册成功结果。
13.根据权利要求11所述的语音识别控制方法,其特征在于,所述根据所述应用单元 的语音消息获取请求的注销信息,对所述应用单元的语音识别控制功能进行注销,包括接收应用单元的发送的语音消息获取请求的注销信息,所述注销信息包括已经注册的 消息接收标识码和四元组信息;若所述消息接收标识码和所述四元组信息正确,则删除所述消息接收标识码和所述四 元组信息,以使所述消息接收标识码失效。
全文摘要
本发明公开了一种语音识别控制系统和方法。其中,该语音识别控制系统包括语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态。本发明具有通用性,可以适用于各种功能的应用单元。
文档编号G06F3/16GK102004624SQ20101054245
公开日2011年4月6日 申请日期2010年11月11日 优先权日2010年11月11日
发明者加雄伟 申请人:中国联合网络通信集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1