用于具有用户可定义约束的小型语音识别的构造的嵌入式系统的制作方法

文档序号:8303515阅读:528来源:国知局
用于具有用户可定义约束的小型语音识别的构造的嵌入式系统的制作方法
【技术领域】
[0001]本公开涉及语音识别(speech recognit1n),并且更具体地,涉及提供声控(voice-activated)或声音命令(voice command)功能的语音识别。
【背景技术】
[0002]语音识别或自动语音识别涉及识别口语词语(spoken words)的计算机化处理。针对语音识别存在多种用途,包括语音转录、语音翻译、通过声音控制装置和软件应用程序的能力、调用路由系统、互联网的声音搜索等。语音识别系统可以可选地与口语语言理解系统(spoken language understanding system)相配对,以在与系统交互时提取待执行的含义和/或命令。
[0003]语音识别系统非常复杂并且通过将话语的声学标记(acoustic signature)与词语的声学标记相匹配来进行操作。这种匹配可以可选地与统计学语言模型相组合。因此,在语音识别处理中使用声学建模和语言建模。声学模型可创建自口语话语(spokenutterances)的录音以及相关联的转录本。然后,声学模型定义了针对相应的词语的单独声音的统计学表示。语音识别系统使用声学模型以识别声音的序列,同时使用统计学语言模型以从识别出的声音识别可能的词语序列(word sequence) ο
[0004]提供声控或声音命令功能的语音识别能使讲话者通过说出各种指令来控制装置和系统。例如,讲话者可说出命令以执行特定任务或说出查询以检索特定结果。口语输入(spoken input)可遵循执行特定任务的一组严格的短语,或者口语输入可以是自然语言,该自然语言由语音识别系统的自然语言单元来解释。声音命令功能在便携装置上变得越来越流行,尤其是电池供电的便携装置,例如,手机、膝上型电脑和平板电脑。

【发明内容】

[0005]给定装置的声音命令模式可主动收听口语命令,或在用户手动激活声音命令模式之前关闭。例如,一些移动电话包括响应于说出的用户输入,诸如呼叫特定个人、检索电子邮件消息、播放特定歌曲等以执行任务的功能。通常,用户将按下电话上的按钮(或选择图标)以激活声音命令模式,然后说出命令,例如呼叫约翰斯密斯”作为响应,电话或装置将开始呼叫相应的电话号码,例如,从联系人列表或其它目录检索电话号码。
[0006]尽管这种声音命令功能比较方便,然而访问这种功能需要用户按下按钮或以其它方式导航到供选择的菜单。因此,启动声音命令模式或特征并不是一个免手动过程。此外,不应将声音命令语音识别引擎作为免手动备选方案持续运行,因为常规语音识别引擎的功率需求很大。例如,连续运行作为声音命令模式的一部分的常规语音识别程序的普通手机会在大约几个小时之内(取决于电池容量的不同)耗尽电池电源的供应。功率消耗也是有线装置或电器存在的一个问题,因为使用常规语音识别系统会对装置的效率评估产生不利影响。由此,需要一种声控“唤醒”功能,其启动移动电话或其它装置的语音识别程序,又能消耗较少的电力,从而提供有效的免手动操作功能。
[0007]因此,本文中公开的技术包括能够进行声音触发的系统和方法,该声音触发以与手动启动声音命令功能(按下按钮)相似的方式唤醒装置或更确切地使装置激活所有/或剩余的声音命令。另外,这种声音触发是动态可编程或可定制的。例如,讲话者可对作为声音触发的特定短语(一个或多个词语)进行编程或指定,并可根据需要更改该声音触发短语。一般来说,本文中的技术运行声控唤醒系统,其在数字信号处理器(DSP)或电子装置的其它低功率的、辅助处理单元上操作。在DSP上运行语音识别程序会出现问题,因为常规语音识别系统相对较大。在DSP上运行唤醒特征的另一个问题是,需要提供动态可编程的唤醒特征。诸如在移动电话组装期间,在唤醒短语是可编程的同时促进了在DSP上运行唤醒系统,允许用户指定命令词语是困难的问题。
[0008]本文中的技术包括在电子装置上运行两个语音识别系统。第一语音系统,其相对大,在装置的中央处理单元(CPU)上运行;第二语音系统,其相对较小,在DSP上运行。给定的便携电子装置的CPU通常能在电子装置处于激活状态的同时进行大多数的处理。DSP通常运行在相对较低的功率上并且通常用于待机处理。例如,当电子装置被实例化为移动电话时,DSP通常负责在电话处于待机模式(CPU处于非激活状态)时收听呼入的电话呼叫。第一语音识别系统提取定制的触发短语,并且将语音模型和代码转换为相对较小的系统。该第二语音系统随后被转移至DSP,使得DSP可在CPU处于非激活状态的同时,例如当电子装置处于待机模式时运行第二语音系统。DSP使用该第二语音系统收听定制的触发短语。检测到说出的自定义触发短语时,DSP指示电子装置返回至激活状态,或其中CPU会对后续声音命令做出响应的状态。通过在DSP上运行较小的第二语音系统,电子装置可提供消耗相对较少电力的免手动声音触发唤醒特征。
[0009]一个实施例包括语音识别管理器,该语音识别管理器在电子装置上运行用于管理语音识别的语音识别处理或系统。语音识别管理器由电子装置的声控唤醒功能(即,用于配置唤醒功能的界面)接收配置输入。配置输入包括触发短语。在电子装置的第一处理器上接收配置输入。该电子装置还具有除了第一处理器之外的第二处理器。语音识别管理器创建与触发短语相对应的语音识别状态的网络。利用第一处理器运行的第一语音识别引擎在第一处理器创建该语音识别状态的网络。语音识别管理器将语音识别状态的网络从第一处理器转移至第二处理器,例如,从CPU转移到DSP。语音识别管理器然后利用与触发短语相对应的语音识别状态的网络在第二处理器运行第二语音识别引擎。在第一处理器的第一语音识别引擎处于非激活状态的同时,第二处理器运行第二语音识别引擎。运行该第二语音识别引擎可包括在第一语音识别引擎或第一处理器处于非激活状态的同时持续分析口语话语。响应于识别包括触发短语的特定口语话语,DSP或语音识别管理器向第一处理器发送信号,以使第一语音识别引擎返回至激活状态,从而启动控制电子装置的声音命令模式。
[0010]本文中的又一其它实施例包括用于执行上文总结的并且在下文详细公开的步骤和操作的软件程序。一个这样的实施例包括具有计算机存储介质(例如,非易失性、有形计算机可读介质;位于不同位置或相同位置的存储介质;计算机存储媒体或介质等)的计算机程序产品,计算机存储介质包括编码在其中的计算机程序逻辑,计算机程序逻辑在具有处理器和相对应存储器的计算机化装置中执行时,对处理器进行编程,以执行(或使处理器进行)本文中所公开的操作。这种布置通常被提供为软件、固件、微代码、代码数据(例如,数据结构)等的形式提供,布置或编码在计算机可读存储介质上,例如,光学介质(例如,CD-ROM)、软盘、硬盘、一个或多个ROM或RAM或PROM芯片、专用集成电路(ASIC)、场可编程门阵列(FPGA)等。软件或固件或其它这种配置可被安装至计算机化装置上,使计算机化装置实施本文中所阐述的技术。
[0011]由此,本公开的一个特定实施例涉及计算机程序产品,该计算机程序产品包括具有存储于其上的指令的一个或多个非易失性计算机存储介质,用于支持例如下列操作:由电子装置的声控唤醒功能接收配置输入,该配置输入包括触发短语,在电子装置的第一处理器上接收配置输入,电子装置具有除了第一处理器之外的第二处理器;创建与触发短语向对应的语音识别状态的网络,利用第一处理器运行的第一语音识别引擎在第一处理器创建该语音识别状态的网络;将该语音识别状态的网络从第一处理器转移至第二处理器;并且利用与触发短语相对应的语音识别状态的网络在第二处理器运行第二语音识别引擎,在第一处理器的第一语音识别引擎处于非激活状态的同时,第二处理器运行第二语音识别引擎。当通过相应的计算机装置的处理器执行该指令和本文中所述的方法时,使处理器执行本文中所公开的方法。
[0012]本公开的其它实施例包括软件程序以执行上文总结并且下面详细公开的方法实施例步骤和操作中的任一个。
[0013]毫无疑问,为了明确起见,已指明了本文所述的不同步骤的讨论顺序。一般来说,这些步骤可以任何适当顺序进行。
[0014]另外,应理解的是,本文的每个系统、方法、装置等可严格实施为软件程序、软件和硬件的组合,或单独的硬件,例如,处理器内的硬件或在操作系统或软件应用内实施或通过非软件应用,例如由人进行所有或一部分操作来实施。
[0015]如上所述,本文中的技术适用于支持声音命令语音识别的软件应用程序。但是,应注意的是,本文中的实施例并不限于用于这些应用程序,本文中讨论的技术也适用于其它应用。
[0016]另外,本文中的不同特征、技术、配置等可在本发明的不同地方进行讨论,但每个概念都可互相独立执行或互相组合执行。由此,本发明可以多种不同的方式实施和查看。
[0017]应注意的是,本文中的该
【发明内容】
部分并没有指出每一个实施例和/或本公开或本发明要求的增加的新颖性方面。相反,这个
【发明内容】
仅提供了不同实施例的初步讨论和与常规技术相比的相对应的创新点。对于本发明和实施例的额外细节和/或可能视角,读者应参见下文进一步讨论的本公开的【具体实施方式】部分和相对应的附图。
【附图说明】
[0018]从下面根据在附图中示出的本文中的优选实施例的更具体的描述,上述及其它目的、特点和优点将是显而易见的,在附图中,贯穿不同的视图的相似的参考符号指代相同的部分。示图并不一定按比例绘制,而是将重点放在对实施例、原理和概念进行图解说明。
[0019]图1为用于根据本文中的实施例
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1