分布式语音识别系统的制作方法

文档序号：9476316阅读：516来源：国知局

分布式语音识别系统的制作方法
【专利说明】
[0001]背景
技术领域
[0002]本发明的实施方案大致涉及语音识别。更具体地是，本发明的实施方案涉及在预期的目标设备上执行声音命令。利用自动语音识别通过口述命令控制或操作独立的目标设备可被用于办公自动化、家庭环境或其它领域。
【背景技术】
[0003]随着计算设备的处理能力的不断增长和计算系统的尺寸的不断降低，语音识别被越来越多地用于在家庭或办公室控制设备。最初，只有计算机可以识别口述命令。但是现在，仅举几个设备的例子，有手机、电视、录像机、灯和安全系统等模型也允许用户使用声音命令控制它们。
[0004]为了更精确地识别声音命令，这些设备中的多数设备使用简化的语言模型。这些设备中的每一个也需要同时包含确定何时其他语音并不意味着命令的能力和区分对自己的命令与对其它设备的命令的能力。例如，每一个设备需要过滤发生在设备附近的解译性对话以及用于其他设备的声音命令。因此，语音识别可能是处理器的密集处理过程。
[0005]另外，这些声音识别系统还必须解析与用户所处的环境相关的其他问题。这些问题可以包含回声、混响和环境噪声。这些问题可以是环境或房间相关的。例如，在繁忙房间内的环境噪声将不同于相对安静的房间内的环境噪声，而大型会议室内的回声将不同于较小的办公室的回声。
[0006]发明概述
[0007]因此，需要将处理器密集处理的普通语音识别算法的负载分流到中央处理环境，同时也允许通过环境内的分布式系统解决关于表示声音命令的数据的一些特定于环境的处理的灵活性。
[0008]因此，实施方案包含用于在预期的目标上执行的声音命令的语音识别的方法。该方法可以包含接收表示声音命令的数据、基于每一个目标的状态信息生成目标列表和基于声音命令从目标列表中选择目标。
[0009]另一个实施方案包含用于声音命令的语音识别的装置。该装置可以包括数据接收模块、列表生成模块和目标选择模块。数据接收模块可以被配置为接收表示声音命令的数据。列表生成模块可以被配置为基于目标的状态生成可能的目标的列表。目标选择模块可以被配置为基于可能的目标列表和声音命令选择预期的目标。
[0010]本发明的更多特征和优点，以及本发明的各种实施方案的结构和操作，将参考附图在下面进行详细描述。应注意，本发明不局限于本文描述的特定的实施方案。本文提出的这些实施方案仅用于阐述的目的。基于本文含有的教导，更多的实施方案对相关领域技术人员将是明显的。
[0011]附图简述
[0012]并入本文并形成说明书的一部分的附图阐述了一些实施方案，并且与描述结合更有助于解释本发明的原理和使相关领域技术人员能够制造和使用本发明。
[0013]图1是在其中可以实施实施方案的示例性通信系统的图示。
[0014]图2是在其中可以实施实施方案的示例性环境的图示。
[0015]图3是依据本发明的实施方案解码声音指令的方法的图示。
[0016]图4是依据本发明的实施方案的用于解码声音指令的目标选择的方法的图示。
[0017]图5是计算机系统示例的图示，本发明的实施方案或其一部分可以作为计算机可读代码在该计算机系统中实施。
[0018]发明详述
[0019]以下的详细描述参考了示出了依据本发明的示例性实施方案的附图。其他实施方案是可能的，并且可以在本发明的精神和范围内对实施方案进行修改。因此，详细的描述并不局限于本发明的范围。相反，所要求保护的主题的范围由所附的权利要求限定。
[0020]以下描述的本发明可以在很多不同的软件、硬件、固件和/或图中阐述的实体的实施方案中实施，这对相关领域技术人员是明显的。因此，本发明的实施方案的可操作的表现将基于对本发明的实施方案的可能的修改和变化的理解进行描述，本文的描述提供了给定的详细程度。
[0021]该说明书公开了包含本发明的特征的一个或多个系统。所公开的系统仅作为本发明的示例。本发明的范围并不局限于所公开的系统。本发明由本文所附的权利要求限定。
[0022]所描述的系统，以及在说明书中引用的“ 一个系统”、“系统”、“示例性系统”等，表明所描述的系统可能包含特殊的特征、结构或特性，但是每一个实施方案可能不必包含该特殊的特征、结构或特性。另外，这些短语不必指同一个系统。另外，当特殊的特征、结构或特性与系统结合进行描述时，应理解无论是否明确描述，所述描述均落入相关领域技术人员结合其他实施方案实现这些特征、结构或特性的知识范围内。
[0023]出于示例的目的，嵌入式搜索算法被用于以下装置、系统和方法的描述。相关领域普通技术人员将认识到这些仅仅是示例以及本发明在其他多个背景中是可用的。
[0024]1.启动器/目标通信系统
[0025]图1是在其中可以实施本文描述的实施方案的示例性通信系统100的图示。通信系统100包含通过网络112可通信地耦合至中央调度单元106的启动器102fl025和目标IlO1-1KV传感器108和执行器104也通过网络112可通信地耦合至中央调度单元106。
[0026]启动器102^10?可以是，例如但不限于，麦克风、移动电话、其他相似类型的电子设备、或其组合。
[0027]目标IlO1-1lO4可以是，例如但不限于，电视、收音机、烤箱、HVAC单元、微波炉、洗衣机、烘干机、洗碗机、其他相似类型的家用和商用设备或其组合。
[0028]中央调度单元106可以是，例如但不限于，电信服务器、网络服务器或其他相似类型的数据库服务器。在实施方案中，中央调度单元106可以具有多个处理器和多个共享的或单独的存储器组件，诸如，例如但不限于，包含在集群计算环境和服务器群中的一个或多个计算设备。由集群计算环境或服务器群执行的计算过程可以跨放置在相同位置或不同位置的多个处理器实现。在实施方案中，中央调度单元106可以在单一计算设备上实施。计算设备的实例包含，但不限于，中央处理单元、专用集成电路、现场可编程门阵列或具有至少一个处理单元和存储器的其他类型的计算设备。
[0029]传感器108可以是，例如但不限于，温度传感器、光传感器、运动传感器或其他相似类型的传感器设备或其组合。
[0030]执行器104可以是，例如但不限于，开关、移动设备、可以改变目标状态的其他相似的物体或其组合。
[0031]另外，网络112可以是，例如但不限于，可通信地将启动器102fl025、目标IlO1-1lO4、传感器108、以及执行器104耦合至中央调度单元106的有线的(如以太网)或无线的(如W1-Fi和3G)网络或其组合。
[0032]在实施方案中，通信系统100可以是家用网络系统(如3G和4G移动通信系统)。用户和环境(如通过图1中的启动器传感器108)可以改变(如通过图1中的执行器104)设备(如图1中的目标IlO1-1lO4)的状态。这可以使用移动通信网络(如图1中的网络112)和家用网络服务器(如图1中的中央调度单元106)完成。
[0033]在实施方案中，通信系统100可以从所接收的数据中去除一个或多个环境条件。例如，它可以从数据中消除噪声，诸如背景或环境噪声；消除回声；从数据中去除混响或其组合。在实施方案中，环境条件的去除可以由启动器102fl025、中央调度单元106、网络112中的其它设备或其组合完成。
[0034]2.示例性家用环境
[0035]图2是可以实施本文的实施方案的示例性家用环境200的图示。家用环境200包含启动器区域202^202。，每一个启动器区域都可以与一个或多个启动器102有关。每一个启动器区域2021-20212表示一个或多个启动器102可以从中接收输入的区域。
[0036]如图2所示，启动器区域2021_20212可以覆盖住宅中的大部分区域，但是不需要覆盖整个住宅。并且，如图2所示，启动器区域2021-20212可以重叠。
[0037]以下对于图3和4的描述基于家用/办公环境，类似于家用环境200。基于本文的描述，相关领域的普通技术人员将认识到本文公开的实施方案可以用于其他类型的环境，例如但不限于，飞机场、火车站以及杂货店等。这些其他类型的环境落入本文描述的实施方案的精神和范围内。
[0038]3.声音命令执行过程
[0039]为使用户更简单有效地在其家中或办公室使用设备，例如，图3中的流程图300阐

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：奥加斯·阿肖克·巴帕特;
技术所有人：赛普拉斯半导体公司;
我是此专利的发明人

上一篇：多识别器语音识别的制作方法
上一篇：用于关键字检测的自适应音频帧处理的制作方法