用于检测目标关键词的方法和设备的制造方法

文档序号：9439059阅读：331来源：国知局

用于检测目标关键词的方法和设备的制造方法
【专利说明】
[0001] 相关申请案的夺叉参考
[0002] 本申请案主张共同拥有的2013年5月7日递交的第61/820,498号美国临时专利申请案、2013年7月26日递交的第61/859, 058号美国临时专利申请案，以及2013年11月 22日递交的第14/087, 939号美国非临时专利申请案的优先权，所述申请案中的每一个的内容以全文引用的方式明确地并入本文中。
技术领域
[0003] 本发明大体上涉及音频处理，并且更确切地说涉及从电子装置的音频输入中检测目标关键词。
【背景技术】
[0004] 近年来，例如智能电话、平板计算机和智能电视等具有声音捕获能力的电子装置的使用已经稳定地逐渐增加。此类电子装置可允许响应于话音关键词激活一或多个应用或功能。由于此类装置的用户通常在随机时间帧中使用此类话音激活特征，所以这些装置通常连续地以激活状态操作以使得能够捕获和处理此类输入声音。
[0005] 连续地以激活状态操作操作此类装置通常允许在从输入声音中检测关键词中接收整个关键词。然而，在移动装置的情况下使用此类装置连续地捕获和处理输入声音以用于检测关键词通常导致增大的电力消耗或缩短的电池寿命。一些装置已经实施工作循环以在接收和处理输入声音流时减少时间。然而，如果来自用户的关键词的开始落入工作循环的非激活状态中，那么可能引起无法检测关键词，需要用户重复关键词。
[0006] 另外，当不同用户说出相同的关键词以激活电子装置中的功能时，他们通常以不同速度说出关键词使得不同的时间周期可能贡献于关键词的每个部分中。为了解决根据用户的差异，一些电子装置已经针对检测关键词处理所有可能的时间周期的所有组合。然而，此类声音处理方法通常增加了计算复杂性并且需要相当大的计算资源。

【发明内容】

[0007] 本发明提供用于检测目标关键词以激活功能或应用的方法和设备。
[0008] 根据本发明的一个方面，公开了一种检测包含多个部分的目标关键词的方法以用于激活电子装置中的功能。所述方法接收从目标关键词的多个部分中的一个起始的输入声音并且从输入声音中提取多个声音特征。另外，所述方法获得描述状态网络的数据，其中状态网络包含单个起始状态、多个输入状态以及从单个起始状态到多个输入状态中的每一个的过渡。基于所提取的声音特征和状态网络，输入声音可以被检测为目标关键词。本发明还描述了涉及此方法的设备、装置、系统、构件的组合以及计算机可读媒体。
[0009] 根据本发明的另一方面，用于检测目标关键词以激活功能的电子装置包含声音传感器和话音激活单元。目标关键词包含多个部分。声音传感器经配置以接收从目标关键词的多个部分中的一个起始的输入声音。话音激活单元经配置以从输入声音中提取多个声音特征、获得描述状态网络的数据，并且基于所提取的声音特征和状态网络确定输入声音是否对应于目标关键词。所述状态网络包含单个起始状态、多个输入状态以及从单个起始状态到多个输入状态中的每一个的过渡。
[0010] 根据本发明的又一方面，公开了一种用于检测电子装置中的目标关键词的方法。目标关键词包含多个部分。所述方法接收输入声音并且从输入声音中提取多个声音特征。另外，所述方法获得与目标关键词的多个部分相关联的状态信息。状态信息包含用于与目标关键词的部分相关联的多个状态的多个持续时间范围。基于所提取的声音特征和状态信息，输入声音被检测为目标关键词。本发明还描述了涉及此方法的设备、装置、系统、构件的组合以及计算机可读媒体。
[0011] 根据本发明的再一方面，公开了一种用于检测包含多个部分的目标关键词的电子装置。所述电子装置包含声音传感器和话音激活单元。声音传感器经配置以接收输入声音。话音激活单元经配置以从输入声音中提取多个声音特征并且获得与目标关键词的多个部分相关联的状态信息。状态信息包含用于与目标关键词的部分相关联的多个状态的多个持续时间范围。话音激活单元进一步经配置以基于所提取的声音特征和状态信息将输入声音检测为目标关键词。
【附图说明】
[0012] 当结合附图读取时，通过参考以下详细描述将理解本发明的发明性方面的实施例。
[0013] 图1说明根据本发明的一个实施例的当在输入声音中检测到目标关键词时激活话音助理应用的移动装置。
[0014] 图2描绘根据本发明的一个实施例的经配置以检测输入声音流中的目标关键词以用于激活电子装置中的功能的电子装置的框图。
[0015] 图3描述根据本发明的一个实施例的经配置以激活话音激活单元并且连续地提供输入声音流给话音激活单元的声音传感器和语音检测器的框图。
[0016] 图4说明根据本发明的一个实施例的输入声音流的图，所述输入声音流最初基于工作循环接收并且一旦在工作循环的激活状态期间接收的部分确定为包含足够强度的且感兴趣的声音则连续地接收。
[0017] 图5是根据本发明的一个实施例的经配置以接收输入声音并且检测输入声音中的目标关键词的话音激活单元的更详细的框图。
[0018] 图6是根据本发明的一个实施例的用于检测输入声音中的目标关键词以用于激活话音助理单元的方法的流程图。
[0019] 图7描述根据一个实施例的确定用于针对目标关键词的多个状态的多个声音特征中的每一个的一组观察分数的图。
[0020] 图8示出了根据一个实施例的用于包含多个输入状态以用于检测目标关键词的马尔可夫链模型下的目标关键词的多个状态顺序的图。
[0021] 图9是示出根据一个实施例的用于以与每个声音特征相关联的多个状态中的每一个结尾的每个状态顺序的最大关键词分数的图。
[0022] 图10是根据本发明的一个实施例的用于确定状态顺序的关键词分数以检测输入声音中的目标关键词的方法的流程图。
[0023] 图11描绘根据本发明的一个实施例的用于在确定用于目标关键词的输入状态的数目中使用的目标关键词的参考状态顺序的图。
[0024] 图12是根据本发明的一个实施例的用于通过对用于目标关键词的参考输入声音进行处理确定用于目标关键词的输入状态的数目的方法的流程图。
[0025] 图13是根据本发明的另一实施例的话音激活单元的框图，所述话音激活单元经配置以接收输入声音并且基于用于与目标关键词相关联的多个状态中的每一个的持续时间的预先确定的范围检测输入声音中的目标关键词。
[0026] 图14示出了根据一个实施例在马尔可夫链模型下用于目标关键词的多个状态顺序的框图，所述状态顺序是基于用于与目标关键词相关联的每个状态的持续时间的范围生成的。
[0027] 图15是根据一个实施例用于基于每个状态的持续时间的预先确定的范围确定最大关键词分数以检测目标关键词的方法的流程图。
[0028] 图16说明无线通信系统中的移动装置的框图，在所述移动装置中可以根据本发明的一些实施例实施用于从输入声音中检测目标关键词以激活功能的方法和设备。
【具体实施方式】
[0029] 现在将详细参考各种实施例，在附图中说明所述实施例的实例。在以下详细描述中，陈述众多具体细节以便提供对本发明的透彻理解。然而，对于所属领域的一般技术人员将是显而易见的是可在没有这些具体细节的情况下实践本发明。在其它情况下，未详细描述众所周知的方法、程序、系统和组件，以便不会不必要地混淆各种实施例的各方面。
[0030] 图1说明根据本发明的一个实施例的当在输入声音中检测到目标关键词时激活话音助理应用130的移动装置120。最初，移动装置120存储目标关键词以用于激活应用或功能，例如，移动装置120中的话音助理应用130。在所说明的实施例中，当用户110向移动装置120说出例如"起始助理"等目标关键词时，移动装置120捕获输入声音并且在输入声音中检测目标关键词。
[0031] 在检测目标关键词之后，移动装置120激活话音助理应用130,其可以响应于来自用户110的其它命令执行额外功能。在一些实施例中，移动装置120可存储多个目标关键词以用于从用户的声音输入中检测目标关键词。目标关键词中的每一个可经配置以激活与移动装置120中的目标关键词相关联的应用或功能。
[0032] 图2描绘根据本发明的一个实施例的经配置以检测输入声音流中的目标关键词以用于激活电子装置200中的功能的电子装置200的框图。如本文所用，术语"声音流"是指一或多个声音信号或声音数据的顺序。另外，术语"目标关键词"是指可用于激活电子装置200中的功能或应用的一或多个词语或声音的任何数字或模拟表示。电子装置200包含声音传感器210、I/O单元220、存储单元230、通信单元240和处理器250。电子装置200可以是配备有声音捕获和处理能力的任何合适的装置，例如，蜂窝式电话、智能电话（例如，移动装置120)、个人计算机、膝上型计算机、平板个人计算机、智能电视、游戏装置、多媒体播放器等。
[0033] 处理器250包含数字信号处理器（DSP) 252和话音助理单元260,并且可以是用于管理和操作电子装置200的应用程序处理器或中央处理单元（CPU)。DSP 252包含语音检测器254和话音激活单元256。在一个实施例中，DSP 252是低功率处理器以用于减少处理声音流中的电力消耗。在此配置中，DSP 252中的话音激活单元256经配置以当在输入声音流中检测到目标关键词时激活话音助理单元260。虽然在所说明的实施例中话音激活单元256经配置以激活话音助理单元260,但是它也可以激活可能与目标关键词相关联的任何功能或应用。
[0034] 声音传感器210可经配置以接收输入声音流并且将它提供给DSP 252中的语音检测器254。声音传感器210可以包含可用于接收、捕获、感测和/或检测到电子装置200的声音输入的一或多个麦克风或任何其它类型的声音传感器。另外，声音传感器210可采用任何合适的软件和/或硬件以用于执行此类功能。
[0035] 在一个实施例中，声音传感器210可经配置以根据工作循环周期性地接收输入声音流。在这种情况下，声音传感器210可确

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金圣雄;李敏秀;金泰殊;真珉豪;黄奎雄;
技术所有人：高通股份有限公司;
我是此专利的发明人