语音控制装置和语音控制方法与流程

文档序号：11679116阅读：363来源：国知局

本案是申请日为2012年11月27日、申请号为201210491178.1、发明名称为“语音控制装置和语音控制方法”的发明专利申请的分案申请。本发明涉及一种语音控制装置和语音控制方法，特别是涉及使用预设的短语唤醒语音控制装置的方法。
背景技术：
：：目前，越来越多的电子装置开始使用语音控制。语音控制今后将成为大多数电子装置常用的使用者界面。但是，对于使用电池的移动电子装置来说，语音引擎的能耗是很高的。让系统的语音引擎一直处于运行状态，将快速地消耗系统的电能。因此目前的移动电子装置均使用按键或类似的机制来触发语音引擎。既然是语音控制，还需要用手来按一下按钮开始，对使用者来说很不方便。如果一直启动语音引擎，又会导致不必要的能量消耗。技术实现要素：本发明提供一种语音控制装置和语音控制方法，可方便地启动语音功能，而且平时可保持低功耗，以解决语音引擎的启动和能源消耗的矛盾。本发明提出一种语音控制装置，包括声音采集器、声音转换器、语音识别器、以及中央处理单元(cpu:centralprocessingunit)。声音采集器采集第一声音信号。声音转换器耦接声音采集器，将第一声音信号从模拟信号转换为数字信号。语音识别器耦接声音转换器，自第一声音信号识别第一语音信号，进行第一语音信号和第二语音信号的第一次比对，并根据上述第一次比对产生唤醒信号。中央处理单元耦接声音转换器和语音识别器，当接收唤醒信号时，自睡眠状态进入工作状态，进行第一语音信号和第二语音信号的第二次比对，并根据上述第二次比对接管来自声音采集器和声音转换器的语音输入。本发明另提出一种语音控制方法，用于语音控制装置，上述的语音控制方法包括下列步骤：采集第一声音信号；自第一声音信号识别第一语音信号；进行第一语音信号和第二语音信号的第一次比对，并根据上述第一次比对产生唤醒信号。回应上述唤醒信号，上述语音控制装置的中央处理单元自睡眠状态进入工作状态，进行第一语音信号和第二语音信号的第二次比对，并根据上述第二次比对接管语音控制装置的语音输入。为使本发明的上述特征和优点能更明显易懂，下文特举实施例，并结合附图详细说明如下。附图说明图1是依照本发明一实施例的一种语音控制装置的示意图。图2a是依照本发明一实施例的一种语音控制方法的流程图。图2b绘示图1的语音控制装置对应图2a的方法流程的信号传送流程。图3a是依照本发明一实施例的一种语音控制方法的流程图。图3b绘示图1的语音控制装置对应图3a的方法流程的信号传送流程。附图符号说明100：语音控制装置110：声音采集器120：声音转换器130：语音识别器140：中央处理单元210～230、305～375：方法步骤具体实施方式图1是依照本发明一实施例的一种语音控制装置100的示意图。语音控制装置100可以是任何移动终端，比如移动电话、个人数字助理(pda:personaldigitalassistant)、平板计算机(tabletcomputer)、笔记型计算机(notebookcomputer)、也可为桌上型计算机之类的任何一种可用语音控制的电子装置。语音控制装置100包括声音采集器110、声音转换器120、语音识别器130、以及中央处理单元140。其中声音转换器120耦接声音采集器110，语音识别器130耦接声音转换器120，中央处理单元140耦接声音转换器120和语音识别器130。本实施例的语音控制装置100可藉由预设的语音启动其语音控制功能。简单的说，声音采集器110采集周遭环境的所有声音，包括使用者发出的声音，输出采集所得的声音信号。声音采集器110可以是麦克风(microphone)或类似的收音装置。声音转换器120将上述声音信号从模拟信号转换为数字信号。语音识别器130和中央处理单元140比对上述的声音信号和预设的另一个声音信号，以决定是否启动语音控制装置100的语音控制功能。图2a是依照本发明一实施例的一种语音控制方法的流程图，此方法是关于如何设置用来启动语音控制装置100的预设语音，此方法可由语音控制装置100执行。图2b绘示语音控制装置100对应图2a的方法流程的信号传送流程。上述的预设语音通常是一个短词或短句，例如简短的口令或密码。或者也可以给语音控制装置100起一个名字，用这个名字做为上述的预设语音。使用者说出这个预设语音之后，在步骤210，声音采集器110采集声音信号，声音转换器120将此声音信号从模拟信号转换为数字信号。声音转换器120也可放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。中央处理单元140在步骤220自此声音信号识别来自使用者的预设语音信号(以下称为vsd)。然后在步骤230中央处理单元140自预设语音信号vsd提取其预设语音特征(以下称为vcd)。中央处理单元140可储存预设语音信号vsd和预设预设语音特征vcd。中央处理单元140也可将预设语音信号vsd传送至语音识别器130，以供语音识别器130储存。预设语音信号vsd就是用来启动语音控制装置100的预设语音。图3a是依照本发明一实施例的一种语音控制方法的流程图，此方法是关于上述的预设语音的比对，此方法可由语音控制装置100执行。图3b绘示语音控制装置100对应图3a的方法流程的信号传送流程。首先，在步骤305，语音控制装置100处于初始状态，也就是中央处理单元140处于睡眠状态，不处理语音输入，由处于工作状态的语音识别器130处理语音输入。中央处理单元140具有工作状态和睡眠状态，语音识别器130也具有工作状态和睡眠状态。工作状态是指正常工作的状态，有正常的能量消耗。睡眠状态是指不工作而等待被唤醒的状态，此时的能量消耗非常低。接下来，声音采集器110在步骤310采集声音信号。声音转换器120可将此声音信号从模拟信号转换为数字信号。声音转换器120也可以放大此声音信号。这个声音信号包括来自使用者的语音和周遭环境的杂音。语音识别器130在步骤315自此声音信号识别来自使用者的输入语音信号(以下称为vsi)。接下来，语音识别器130在步骤320进行输入语音信号vsi和预设语音信号vsd的第一次比对，在步骤325判断这两个语音信号是否符合。如果输入语音信号vsi不符合预设语音信号vsd，流程返回步骤305。如果输入语音信号vsi符合预设语音信号vsd，则语音识别器130在步骤330产生一个唤醒信号以唤醒中央处理单元140。中央处理单元140在步骤335接收唤醒信号，在步骤340自睡眠状态进入工作状态。中央处理单元140自语音识别器130接收输入语音信号vsi，然后在步骤345至365进行输入语音信号vsi和预设语音信号vsd的第二次比对。中央处理单元140在步骤345比对输入语音信号vsi和预设语音信号vsd，在步骤350判断这两个语音信号是否符合。如果输入语音信号vsi不符合预设语音信号vsd，则中央处理单元140重新进入睡眠状态，流程返回步骤305。如果输入语音信号vsi符合预设语音信号vsd，则中央处理单元140在步骤355自输入语音信号vsi提取其输入语音特征(以下称为vci)，在步骤360比对输入语音特征vci和预设语音特征vcd，然后在步骤365判断这两组语音特征是否符合。如果输入语音特征vci不符合预设语音特征vcd，则中央处理单元140重新进入睡眠状态，流程返回步骤305。如果输入语音特征vci符合预设语音特征vcd，则中央处理单元140在步骤370接管语音控制装置100的语音输入，也就是来自声音采集器110和声音转换器120的语音输入。语音识别器130在此时自工作状态进入睡眠状态。中央处理单元140执行语音控制装置100的语音引擎，所以步骤370就是启动语音控制装置100的语音引擎和语音控制功能。接下来，中央处理单元140在步骤375检查是否中央处理单元140在进入工作状态之后的一段预设时间内未自上述的语音输入识别出任何语音信号。如果中央处理器140有在预设时间内识别出语音信号，则流程返回步骤370。如果中央处理器140没有在预设时间内识别出任何语音信号，表示使用者没有在预设时间内发出任何语音指令，则中央处理单元140重新进入睡眠状态，而语音识别器130则重新进入工作状态，流程返回步骤305。在本实施例中，语音识别器130和中央处理单元140各进行一次输入语音信号vsi和预设语音信号vsd的比对。因为语音识别器130是超低功耗的低成本电路，上述比对的错误识别率高于中央处理单元140。而且声音采集器110必须连续不断地采集声音信号，所以语音识别器130必须自连续不断的声音信号中识别来自使用者的语音，这会进一步提高语音识别器130的错误识别率。所以本实施例在语音识别器130的初次比对之后，让中央处理单元140再次确认。中央处理单元140具有较高的运算能力，可使用更准确的演算法来比对输入语音信号vsi和预设语音信号vsd，以降低错误识别率。在本实施例中，语音信号的比对是为了确认使用者说出正确的预设语音，语音特征的比对则是为了确认使用者的身份，因为每个人的语音特征各不相同。比对语音特征可限制只有特定的使用者能启动语音控制装置100的语音引擎。如果不需要限制使用者身份，则可省略图2a的步骤230和图3a的步骤355至365，在此情况下，如果步骤350的结果为符合，则流程直接进入步骤370。语音识别器130就是一个简化版的低功耗语音识别引擎，专门识别一个可预设的简短语音，当识别到这个预设语音时，启动中央处理单元140所执行的正规语音引擎。语音识别器130只需要做单独一个简短语音的发音匹配，不需要声学词典和语言模型，因此规模与功耗远小于正规的语音识别引擎。这样，即可以达到很低的待机功耗，又让使用者可以直接用语音来启动语音控制，使语音控制装置更好用，更方便。因此，以上实施例可解决语音引擎的启动和能源消耗的矛盾。虽然本发明已以实施例揭示如上，然其并非用以限定本发明，本领域的技术人员，在不脱离本发明的精神和范围的前提下，可作若干的更动与润饰，故本发明的保护范围是以本发明的权利要求为准。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张国峰
技术所有人：威盛电子股份有限公司
我是此专利的发明人