混合性能缩放或语音识别的制作方法_4

文档序号:9476313阅读:来源:国知局
录的非触觉输入与存储在处于中间功率状态的客户端装置平台105可访问的更大存储器上的一个或多个第二基准输入之间的相似度。第二基准信号可以与第一基准信号相同,并且还可以包括将占用太多空间的另外基准信号,因此,该另外基准信号可能未被存储在低功率状态下可用的有限存储器中。例如,除了可以被存储在低功率存储器148中的基准信号“装置接通”以外,更长的基准输入诸如“装置接通-玩视频游戏一”可在中间功率状态下访问。因此,具有对应于更复杂操作的基准信号是可能的,诸如比将客户端装置平台105从低功率状态简单唤醒更复杂的操作。借助示例,而不是为了限制,除了启动全功率状态的操作以外,操作还可以包括指示客户端装置平台105加载某些媒体标题,诸如视频游戏、电影或歌曲,将客户端装置平台105调谐到预期的输入或频道或它们的任何组合。此外,中间功率状态增加的存储器空间或处理能力的量还可以允许算法经训练识别特定个人的声音或脸部。这可能是有益的,因为它可以用于执行指示客户端装置平台105加载与已识别的个人相关联的设定的另外操作。借助示例,而不是为了限制,该设定可以包括期望的音量级、显示器设定、登录信息或它们的任何组合。
[0047]第二置信度得分可以通过使用一个或多个另外的算法来生成。因为有更多可用的(PU周期,这些算法可能更加稳健并能够对非触觉输入进行更详细的分析。借助示例,而不是为了限制,如果所记录的非触觉输入是音频数据,那么第二置信度得分可以用高质量ASR来生成,诸如可以并入听觉注意提示的用途的ASR,或通过将所记录的语音划分为音标或通过使用多信道数据的阵列和AEC以取代在低功率模式下的单信道数据的ASR。如果所记录的非触觉输入是视频数据,则第二置信度得分可以通过使用面部识别算法或高级手势识别算法来生成。另外,如果所记录的非触觉包括音频数据和视频数据两者,那么音视听语音识别(AVSR)算法可以与高级ASR算法组合使用以更准确分析非触觉输入。可以在中间功率状态下使用以提高置信度得分的其他方法包括但不限于说话者声音识别、唇读、手势识别、能够被使用的运动识别、声音事件检测(例如,鼓掌、玻璃破碎、敲击、踏步等)。
[0048]在已生成第二置信度得分之后,过程200可以继续进行到判定块266。在块266,客户端装置平台可以确定第二置信度得分是否高于第二阈值水平。如果第二置信度得分低于第二阈值水平,那么过程200返回到低功率状态,如块267所示,并在块261继续记录非触觉输入。如果第二置信度得分等于或高于第二阈值水平,那么过程200继续进行到块267,在块267生成命令信号,该命令信号指示客户端装置平台105执行已与一个或多个所记录的非触觉输入相匹配的基准信号相关联的一个或多个操作。
[0049]根据本公开的另外方面,可以有两个或多个并入过程200中的中间功率状态。每一个随后的中间功率状态可以允许另外的CPU周期处理非触觉输入。借助示例,第一中间功率状态可以包括激活多核CPU 131的单核,以及第二中间功率状态可以包括激活多核CPU 131的一个或多个另外的核。另外的中间功率状态可以允许在分配后面的置信度得分之前使用更高级的算法。这可以减少将导致客户端装置平台105错误启动操作的误报的数量。
[0050]图3是根据本公开的另外方面,描述实施通过非触觉输入信号来启动的一个或多个操作的过程300的流程图,其中非触觉输入信号可由客户端装置平台105检测,同时客户端装置平台105处于低功率状态。在低功率状态运行时,过程300基本类似于过程200直到判定块363之后。当第一置信度得分等于或高于第一阈值水平之后,低功率处理器通过网络160向基于云的服务器106传送所记录的非触觉输入,如在块364所示。第二置信度得分随后在365通过基于云的服务器106生成。在基于云的服务器106上的处理器131’可以以基本类似于在过程200中所述生成第二置信度得分所使用的方式实施。使用基于云的处理能力允许客户端装置平台105允许通过保持在低功率状态来省电。使用基于云的服务器106生成第二置信度得分也提供另外的益处。一种此类益处是基于云的服务器106上的存储器132’可以更大并因此能够保持更多的基准输入,从而允许用过程300实施更加多样化的操作。另外,因为基准信号被存储在云上,它们可以更经常被更新,因为可以连接到基于云的服务器的每一个客户端装置平台105将不需要在它们每次改变时下载新的基准输入。例如,来自别人的实时数据可以用于帮助提高新用户的性能。
[0051]—旦已生成第二置信度得分,过程300继续进行到判定块366。如果第二置信度得分低于第二阈值,那么过程300返回块361并继续记录非触觉输入。当第二置信度得分高于第二阈值时,过程300继续进行到块367。在块367,基于云的服务器106向客户端装置平台105传送命令信号,该命令信号指示客户端装置平台105执行与通过所记录的非触觉输入匹配的一个或多个基准输入相关联的一个或多个操作。
[0052]在某些实施中,信号(例如,面部图像)可以发送到适当的移动电话(例如,用户或父母的)进行验证以允许该装置上电与否。另选地,此类图像可以发送到正监测或保护房屋的安全操作员。
[0053]如图4所示,一组客户端装置平台指令470可以通过客户端装置平台105来实施。客户端装置平台指令470可以在非临时性计算机可读介质诸如存储器132、低功率存储器148或大容量存储装置134上形成。客户端装置平台指令470还可以是过程控制程序133的一部分。指令包括用传感器146记录非触觉输入的指令,并且在471将它们保存到存储器。接下来在472,可以有用于生成第一置信度得分的指令。此后,在473,客户端装置平台105可以被提供用于确定第一置信度得分是否高于第一阈值水平的指令。接下来,当第一置信度得分高于第一阈值水平时,客户端装置平台可以在474被命令启动中间功率状态。在中间功率状态,客户端装置平台105可以在475被命令生成第二置信度得分。接下来,可以有用于在476确定第二置信度得分是否高于第二阈值水平的指令。此后,指令470可以包括用于生成促使客户端装置平台105在478执行一个或多个操作的命令信号的指令。
[0054]如图5所示,一组客户端装置平台指令570可以例如通过客户端装置平台105来实施。客户端装置平台指令570可以在非临时性计算机可读介质诸如存储器132、低功率存储器148或大容量存储装置134上形成。客户端装置平台指令570还可以是过程控制程序133的一部分。指令包括用传感器146记录非触觉输入的指令,并且在571将它们保存到存储器。接下来在572,可以有用于生成第一置信度得分的指令。此后,在573,客户端装置平台105可以被提供用于确定第一置信度得分是否高于第一阈值水平的指令。接下来,当第一置信度得分高于第一阈值水平时,客户端装置平台105可以被命令在574通过网络160向外部服务器传送所记录的非触觉输入。指令570可以随后包括在575生成第二置信度得分的指令。接下来,可以有用于在576确定第二置信度得分是否高于第二阈值水平的指令。此后,指令570可以包括用于通过网络160向客户端装置平台105传送命令信号的指令,在客户端装置平台105收到该指令时,促使该客户端装置平台在477执行一个或多个操作。
[0055] 虽然以上是本发明的优选实施例的完整描述,但使用各种替代、更改和等同物是可能的。因此,不应该参考上面的说明书来确定本发明的范围,而是应该参考所附的权利要求书以及其等同物的全范围来确定。本文所述的任何特征,无论其是否优选,都可以与本文所述的无论是否优选的任何其他特征组合。在所附的权利要求中,不定冠词“一个(A/An)”指的是后面跟随的物品的一项或多项的数量,除非另有明确陈述。所附权利要求书不应解释为包括方法加功能的限制,除非此类限制在给定的使用短语“用于...的方法”的权利要求中明确描述。
【主权项】
1.一种方法,其包括: 用一个或多个传感器将一个或多个非触觉输入记录到装置,其中所述一个或多个输入被记录到第一存储器,其中所述装置在低功率状态下运行,在所述低功率状态下,电源提供给第一处理器和所述
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1