用于娱乐系统的用户界面的制作方法

文档序号:13516597阅读:156来源:国知局
用于娱乐系统的用户界面的制作方法

本申请是申请号为201380014806.x、发明名称为“用于娱乐系统的用户界面”、国际申请日为2013年8月16日的专利申请的分案申请,其全部内容通过引用合并于此。



背景技术:

一些可用来访问娱乐内容(例如音频和/或视频内容)的电子设备包括或者连接到调谐器,调谐器使得电子设备能够接收和显示安排的节目内容,诸如电视、电台或其他媒体节目。为了选择特定的节目用于在电子设备上查看,用户一般使用遥控设备以输入与特定节目(例如广播)相关联的频道的数字。一些可调谐电子设备还允许用户使用遥控设备以使用电子节目指南(epg)搜索和选择内容,epg是以基于时间的网格格式显示用于安排的当前和未来节目内容的安排信息的用户界面。用户通常通过按下遥控设备上的按钮而导航通过在epg中显示的安排的节目内容条目,遥控设备使用五向导航命令系统(左、右、上、下和选择)。一旦用户已经在epg上突出显示特定的节目,则可以通过按下遥控设备上的选择按钮,在电子设备上显示对应的内容,在这之后,电子设备被调谐到所选的频道。



技术实现要素:

一个实施例针对一种在电子设备上呈现搜索结果的方法,其中所述电子设备包括被配置为调谐所述电子设备以接收安排的节目的调谐器。所述方法包括:接收包括搜索查询的语音输入;至少部分地基于所述搜索查询,用至少一个处理器搜索至少一个数据源;和使用基于时间的轴和与时间无关的轴来呈现搜索的结果。

在一个方面,与时间无关的轴基于与所述搜索查询中的一个或多个项的相关度来对所述结果进行排序。

在另一方面,搜索至少一个数据源包括搜索至少一个安排的节目内容数据源和至少一个捆绑服务内容数据源。

在另一方面,所述结果包括在所述至少一个安排的节目内容数据源中所标识的安排的节目内容和在所述至少一个捆绑服务内容数据源中所标识的捆绑服务内容。

在另一方面,所述结果包括捆绑服务内容,当所述捆绑服务内容被选择时,显示来自与所选择的捆绑服务内容相关联的至少一个捆绑服务内容数据源的多个结果。

在另一方面,基于时间的轴区分当前能用于回放的第一内容与当前不能用于回放的第二内容。

在另一方面,沿着基于时间的轴呈现的所述结果只包括安排的节目内容。

另一实施例针对一种电子设备,包括:被配置为调谐所述电子设备以接收安排的节目的调谐器;和至少一个处理器,所述至少一个处理器被编程为:接收包括搜索查询的语音输入;至少部分地基于所述搜索查询,搜索至少一个数据源;和使用基于时间的轴和与时间无关的轴来呈现搜索的结果。

在一个方面,与时间无关的轴基于与所述搜索查询中的一个或多个项的相关度来对所述结果进行排序。

在另一方面,所述电子设备还包括:语音输入接口,被配置为接收所述搜索查询作为语音输入。

在另一方面,搜索至少一个数据源包括搜索至少一个安排的节目内容数据源和至少一个捆绑服务内容数据源。

在另一方面,所述结果包括捆绑服务内容,当所述捆绑服务内容被选择时,显示来自与所选择的捆绑服务内容相关联的至少一个捆绑服务内容数据源的多个结果。

在另一方面,基于时间的轴区分当前能用于由所述电子设备回放的第一内容与当前不能用于由所述电子设备回放的第二内容。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种方法,所述方法包括:接收包括搜索查询的语音输入;至少部分地基于所述搜索查询,搜索至少一个数据源;和使用基于时间的轴和与时间无关的轴来呈现搜索的结果。

在一个方面,与时间无关的轴基于与所述搜索查询中的一个或多个项的相关度来对所述结果进行排序。

另一实施例针对一种在被配置为显示安排的节目内容的数字式可调谐的电子设备的视觉用户界面上呈现搜索结果的方法,所述方法包括:接收搜索查询;至少部分地基于对所述搜索查询的自然语言理解分析,搜索至少一个安排的节目内容数据源和至少一个捆绑服务内容数据源;和在该用户界面上呈现搜索的结果,其中搜索的所述结果组合对应于安排的节目内容的至少一个第一结果和对应于捆绑服务内容的至少一个第二结果。

在一个方面,所述至少一个第二结果包括至少一个捆绑服务结果,当所述至少一个捆绑服务结果被选择时,显示来自对应的捆绑服务数据源的多个结果。

在另一方面,所述至少一个捆绑服务数据源包括用于基于web的服务的数据源。

在另一方面,所述至少一个捆绑服务数据源包括与所述电子设备相关联的本地数据源。

在另一方面,所述至少一个捆绑服务数据源包括经由网络连接的多个数据源。

在另一方面,所述至少一个捆绑服务数据源包括点播内容的数据源。

在另一方面,呈现搜索的所述结果包括呈现与搜索的所述结果中的至少一个对应的图像。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种在被配置为显示安排的节目内容的数字式可调谐的电子设备的视觉用户界面上呈现搜索结果的方法,所述方法包括:接收搜索查询;至少部分地基于对所述搜索查询的自然语言理解分析,搜索至少一个安排的节目内容数据源和至少一个捆绑服务内容数据源;和在该用户界面上呈现搜索的结果,其中搜索的所述结果组合对应于安排的节目内容的至少一个第一结果和对应于捆绑服务内容的至少一个第二结果。

在一个方面,呈现搜索的所述结果包括呈现与搜索的所述结果中的至少一个对应的图像。

另一实施例针对一种被配置为显示安排的节目内容的数字式可调谐的电子设备,所述电子设备包括:至少一个处理器,所述至少一个处理器被编程为:接收搜索查询;至少部分地基于对所述搜索查询的自然语言理解分析,搜索至少一个安排的节目内容数据源和至少一个捆绑服务内容数据源;和在用户界面上呈现搜索的结果,其中搜索的所述结果组合对应于安排的节目内容的至少一个第一结果和对应于捆绑服务内容的至少一个第二结果。

在一个方面,所述至少一个第二结果包括至少一个捆绑服务结果,当所述至少一个捆绑服务结果被选择时,显示来自对应的捆绑服务数据源的多个结果。

在另一方面,所述至少一个捆绑服务数据源包括用于基于web的服务的数据源。

在另一方面,所述至少一个捆绑服务数据源包括与所述电子设备相关联的本地数据源。

在另一方面,所述至少一个捆绑服务数据源包括经由网络连接的多个数据源。

在另一方面,所述至少一个捆绑服务数据源包括点播内容的数据源。

另一实施例针对一种提供用于数字式可调谐的电子设备的用户界面的方法,所述电子设备被配置为显示安排的节目内容,所述方法包括:在所述用户界面上显示多个与内容无关的标签,所述多个与内容无关的标签包括与内容无关的第一标签,该与内容无关的第一标签标识从搜索返回的第一内容单元;和响应于接收到对应于与内容无关的第一标签的第一输入,执行与第一内容单元有关的至少一个动作,其中第一输入包括第一语音输入,并且其中与内容无关的第一标签被配置为对第一语音输入进行响应。

在一个方面,所述方法还包括:接收第二输入,其中所述多个与内容无关的标签中的与内容无关的第二标签被配置为对第二输入进行响应;和其中执行与第一内容单元有关的所述至少一个动作包括至少部分地基于第二输入来执行所述至少一个动作。

在另一方面,第二输入是第二语音输入,并且其中与内容无关的第二标签被配置为对第二语音输入进行响应。

在另一方面,接收第一输入和接收第二输入包括在接收第一输入之前接收第二输入。

在另一方面,所述方法还包括:基于第一输入选择第一内容单元。

在另一方面,执行与第一内容单元有关的至少一个动作包括将所述电子设备调谐到频道以显示用于第一内容单元的安排的节目。

在另一方面,第一内容单元对应于包括多个搜索结果的捆绑服务内容单元,其中执行与第一内容单元有关的至少一个动作包括显示所述多个搜索结果。

在另一方面,所述方法还包括:将多个语音命令与所述用户界面相关联,其中所述多个语音命令包括第一语音命令和第二语音命令,其中第一语音命令调用第一动作并且第二语音命令调用第二动作,并且其中第一语音命令和第二语音命令由所述电子设备识别,而不考虑在所述用户界面上显示的特定屏幕。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种提供用于数字式可调谐的电子设备的用户界面的方法,所述电子设备被配置为显示安排的节目内容,所述方法包括:在所述用户界面上显示多个与内容无关的标签,所述多个与内容无关的标签包括与内容无关的第一标签,该与内容无关的第一标签标识从搜索返回的第一内容单元;和响应于接收到对应于与内容无关的第一标签的第一输入,执行与第一内容单元有关的至少一个动作,其中第一输入是第一语音输入,并且其中与内容无关的第一标签被配置为对第一语音输入进行响应。

另一实施例针对一种被配置为显示安排的节目内容的数字式可调谐的电子设备,所述电子设备包括:至少一个处理器,所述至少一个处理器被编程为:在用户界面上显示多个与内容无关的标签,所述多个与内容无关的标签包括与内容无关的第一标签,该与内容无关的第一标签标识从搜索返回的第一内容单元;和响应于接收到对应于与内容无关的第一标签的第一输入,执行与第一内容单元有关的至少一个动作,其中第一输入是第一语音输入,并且其中与内容无关的第一标签被配置为对第一语音输入进行响应。

在一个方面,所述至少一个处理器还被编程为:接收第二输入,其中所述多个与内容无关的标签中的与内容无关的第二标签被配置为对第二输入进行响应;和其中执行与第一内容单元有关的所述至少一个动作包括至少部分地基于第二输入来执行所述至少一个动作。

在另一方面,所述执行与第一内容单元有关的至少一个动作包括将所述电子设备调谐到频道以显示用于第一内容单元的安排的节目。

在另一方面,第一内容单元对应于包括多个搜索结果的捆绑服务内容单元,其中执行与第一内容单元有关的至少一个动作包括显示所述多个搜索结果。

另一实施例针对一种数字式可调谐的电子设备,包括至少一个处理器,所述至少一个处理器被编程为:提供用户界面,所述用户界面使得所述电子设备能够接收搜索查询而不管当所述搜索查询被接收到时多个屏幕中的哪个被显示在所述用户界面上,其中所述搜索查询包括对要在所述数字式可调谐的电子设备上显示和/或回放的内容的搜索;接收包括所述搜索查询的语音输入;和响应于接收到所述搜索查询,启动对应于所述搜索查询的对内容的搜索。

在一个方面,启动对内容的搜索包括将对内容的查询发送到通过一个或多个网络连接到所述电子设备的至少一个数据源。

在另一方面,所述至少一个处理器还被编程为:在所述用户界面上显示一个或多个图标,所述一个或多个图标指示用户能用来启动对内容的搜索的输入。

在另一方面,所述至少一个处理器还被编程为:将多个语音命令与所述用户界面相关联,其中所述多个语音命令包括第一语音命令和第二语音命令,其中第一语音命令调用第一动作并且第二语音命令调用第二动作。

在另一方面,第一动作和/或第二动作对应于启动对内容的搜索。

另一实施例针对一种计算机实现的方法,包括:提供用户界面,所述用户界面使得电子设备能够接收搜索查询而不管当所述搜索查询被接收到时多个屏幕中的哪个被显示在所述用户界面上,其中所述搜索查询包括对要在所述电子设备上显示和/或回放的内容的搜索;接收包括所述搜索查询的语音输入;和响应于接收到所述搜索查询,启动对应于所述搜索查询的对内容的搜索。

在一个方面,启动对内容的搜索包括将对内容的查询发送到通过一个或多个网络连接到所述电子设备的至少一个数据源。

在另一方面,所述计算机实现的方法还包括:在所述用户界面上显示一个或多个图标,所述一个或多个图标指示用户能用来启动对内容的搜索的输入。

在另一方面,所述计算机实现的方法还包括:将多个语音命令与所述用户界面相关联,其中所述多个语音命令包括第一语音命令和第二语音命令,其中第一语音命令调用第一动作并且第二语音命令调用第二动作。

在另一方面,第一动作和/或第二动作对应于启动对内容的搜索。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种方法,所述方法包括:提供用户界面,所述用户界面使得电子设备能够接收搜索查询而不管当所述搜索查询被接收到时多个屏幕中的哪个被显示在所述用户界面上,其中所述搜索查询包括对要在数字式可调谐的电子设备上显示和/或回放的内容的搜索;接收包括所述搜索查询的语音输入;和响应于接收到所述搜索查询,启动对应于所述搜索查询的对内容的搜索。

在一个方面,启动对内容的搜索包括将对内容的查询发送到通过一个或多个网络连接到所述电子设备的至少一个数据源。

在另一方面,所述方法还包括:在所述用户界面上显示一个或多个图标,所述一个或多个图标指示用户能用来启动对内容的搜索的输入。

在另一方面,所述方法还包括:将多个语音命令与所述用户界面相关联,其中所述多个语音命令包括第一语音命令和第二语音命令,其中第一语音命令调用第一动作并且第二语音命令调用第二动作。

在另一方面,第一动作和/或第二动作对应于启动对内容的搜索。

另一实施例针对一种数字式可调谐的电子设备,包括至少一个处理器,所述至少一个处理器被编程为:接收第一输入;响应于识别到第一输入而进入监听模式;确定在当所述电子设备处于所述监听模式中时的特定时间量期间是否接收到第二输入,其中第一输入和/或第二输入是语音输入;和响应于确定在所述特定时间量期间没有接收到第二输入而退出所述监听模式。

在一个方面,第二输入是退出所述监听模式的显式命令;并且所述至少一个处理器还被编程为响应于接收到第二输入而退出所述监听模式。

在另一方面,所述至少一个处理器还被编程为响应于退出所述监听模式而对第一输入进行监测。

在另一方面,所述电子设备还包括至少一个显示器,并且所述至少一个处理器还被编程为在所述至少一个显示器上显示对所述电子设备当前是否处于监听模式中的指示。

在另一方面,所述指示包括一个或多个选择标签和/或图标。

在另一方面,所述至少一个处理器还被编程为:确定所述电子设备是否处于监听模式中;和响应于确定所述电子设备处于监听模式中而显示与内容无关的多个语音标签。

在另一方面,所述至少一个处理器还被编程为:响应于确定所述电子设备不处于所述监听模式中而隐藏所述与内容无关的多个语音标签。

另一实施例针对一种计算机实现的方法,包括:接收第一输入;响应于识别到第一输入,使得电子设备进入监听模式;确定在当所述电子设备处于所述监听模式中时的特定时间量期间是否接收到第二输入,其中第一输入和/或第二输入是语音输入;和响应于确定在所述特定时间量期间没有接收到第二输入而退出所述监听模式。

在另一方面,第二输入是退出所述监听模式的显式命令;并且所述方法还包括响应于接收到第二输入而退出所述监听模式。

在另一方面,所述电子设备包括至少一个显示器,并且所述方法还包括在所述至少一个显示器上显示对所述电子设备当前是否处于监听模式中的指示。

在另一方面,所述指示包括一个或多个选择标签和/或图标。

在另一方面,所述方法还包括:确定所述电子设备是否处于监听模式中;响应于确定所述电子设备处于监听模式中而显示与内容无关的多个语音标签;和响应于确定所述电子设备不处于所述监听模式中而隐藏所述与内容无关的多个语音标签。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种方法,所述方法包括:接收第一输入;响应于识别到第一输入,使得电子设备进入监听模式;确定在当所述电子设备处于所述监听模式中时的特定时间量期间是否接收到第二输入,其中第一输入和/或第二输入是语音输入;和响应于确定在所述特定时间量期间没有接收到第二输入而退出所述监听模式。

在一个方面,所述电子设备包括至少一个显示器,并且所述方法还包括:在所述至少一个显示器上显示对所述电子设备当前是否处于监听模式中的指示。

在另一方面,所述指示包括一个或多个选择标签和/或图标。

在另一方面,所述方法还包括:确定所述电子设备是否处于监听模式中;响应于确定所述电子设备处于监听模式中而显示与内容无关的多个语音标签;和响应于确定所述电子设备不处于所述监听模式中而隐藏所述与内容无关的多个语音标签。

另一实施例针对一种对要在数字式可调谐的电子设备上显示和/或回放的内容进行搜索的方法,所述电子设备被配置为显示安排的节目内容。所述方法包括:从用户接收包括搜索查询的语音输入,其中所述搜索查询包括对要在所述电子设备上显示和/或回放的所述内容的搜索;基于所述搜索查询确定用户想要执行的动作;至少部分地基于用户想要执行的所述动作,确定要搜索一个或多个数据源;和至少部分地基于所述搜索查询,在所述一个或多个数据源中搜索要在所述电子设备上显示和/或回放的所述内容。

在一个方面,确定用户想要执行的所述动作包括:确定用户想要收听媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为音乐数据源。

在另一方面,确定用户想要执行的所述动作包括:确定用户想要观看媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为至少一个安排的节目内容源。

在另一方面,所述方法还包括:存储一个或多个规则,所述一个或多个规则将特定类型的输入与用于搜索所述一个或多个数据源的特定顺序相关联;和其中搜索所述一个或多个数据源包括:根据所述一个或多个规则来搜索所述一个或多个数据源。

在另一方面,搜索所述一个或多个数据源包括搜索所有可用的数据源。

在另一方面,所述方法还包括:从所述一个或多个数据源接收搜索结果;和在用户界面上呈现所述搜索结果。

另一实施例针对一种以多个指令编码的计算机可读存储介质,当所述指令由至少一个计算机执行时,执行一种对要在数字式可调谐的电子设备上显示和/或回放的内容进行搜索的方法,所述电子设备被配置为显示安排的节目内容。所述方法包括:从用户接收包括搜索查询的语音输入,其中所述搜索查询包括对要在所述电子设备上显示和/或回放的所述内容的搜索;基于所述搜索查询确定用户想要执行的动作;至少部分地基于用户想要执行的所述动作,确定要搜索一个或多个数据源;和至少部分地基于所述搜索查询,在所述一个或多个数据源中搜索要在所述电子设备上显示和/或回放的所述内容。

在一个方面,确定用户想要执行的所述动作包括:确定用户想要收听媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为音乐数据源。

在另一方面,确定用户想要执行的所述动作包括:确定用户想要观看媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为至少一个安排的节目内容源。

在另一方面,所述方法还包括:存储一个或多个规则,所述一个或多个规则将特定类型的输入与用于搜索所述一个或多个数据源的特定顺序相关联;和搜索所述一个或多个数据源包括:根据所述一个或多个规则来搜索所述一个或多个数据源。

另一实施例针对一种被配置为显示安排的节目内容的数字式可调谐的电子设备,所述电子设备包括:至少一个处理器,所述至少一个处理器被编程为:从用户接收包括搜索查询的语音输入,其中所述搜索查询包括对要在所述电子设备上显示和/或回放的所述内容的搜索;基于所述搜索查询确定用户想要执行的动作;至少部分地基于用户想要执行的所述动作,确定要搜索一个或多个数据源;和至少部分地基于所述搜索查询,在所述一个或多个数据源中搜索要在所述电子设备上显示和/或回放的所述内容。

在一个方面,确定用户想要执行的所述动作包括:确定用户想要收听媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为音乐数据源。

在另一方面,确定用户想要执行的所述动作包括:确定用户想要观看媒体内容,并且确定要搜索的一个或多个数据源包括:确定所述一个或多个数据源为至少一个安排的节目内容源。

在另一方面,所述至少一个处理器还被编程为存储一个或多个规则,所述一个或多个规则将特定类型的输入与用于搜索所述一个或多个数据源的特定顺序相关联;和搜索所述一个或多个数据源包括:根据所述一个或多个规则来搜索所述一个或多个数据源。

在另一方面,搜索所述一个或多个数据源包括搜索所有可用的数据源。

应当理解,下面更详细地讨论的前述概念和另外的概念的所有组合(如果这样的概念不是相互不一致的话)被认为是这里所公开的本发明主题的一部分。

附图说明

附图不旨在按比例绘制。在附图中,在各图中示出的每个相同或近乎相同的组件用相同的数字标号表示。为清楚起见,可能不是每个组件在每张附图中均被标记。在附图中:

图1是包括本发明的一些实施例的与用于娱乐系统的搜索界面有关的组件的示例性系统;

图2是根据本发明的一些实施例的用于在用户界面上呈现对内容查询的结果的处理;

图3是根据本发明的一些实施例的用于显示对内容查询的结果的用户界面的部分的示意图;

图4是根据本发明的一些实施例的用于显示对内容查询的混合结果的用户界面的部分的示意图;

图5是根据本发明的一些实施例的显示用户可使用输入而与之交互的语音标签的用户界面的部分的示意图;

图6是根据本发明的一些实施例的用于使用监听模式对输入监测的示例性处理;和

图7是可用于实现本发明的一些实施例的示例性计算机系统。

具体实施方式

本发明人已经认识到并理解,可以改善对在电子设备上查看的内容的搜索,该电子设备包括用于显示安排的节目内容的调谐器。上述类型的电子节目指南(epg)常用于搜索并选择安排的节目内容以在可调谐电子设备上查看,并且使用与安排的节目内容可用于查看的时间相对应的网格样的显示格式被配置。epg显示的网格格式被设计以接收来自使用五向导航命令系统的遥控设备的输入以移动光标至网格中的不同条目。本发明人已经认识到,使用常规epg显示的导航是麻烦的。为了使用五向导航命令系统来导航通过常规网格样的epg显示中的条目,可能要求用户提供一系列的导航命令(例如,“下-下-下-右-选择”),这没有产生对于选择特定节目的用户的高效或直观的体验。

本发明人已经认识到,常规epg搜索系统的显示是“视觉第一”的用户界面,其中该界面的主要焦点是以在视觉上一致的盒子显示安排的节目内容。本发明人已经理解,用于搜索内容的其他技术是可行的,这些技术不需要被安排节目内容的严格视觉呈现,因为用户并不局限于使用五向导航命令系统来导航被显示的条目。为此,本发明的一些实施例针对用于改进的视觉搜索界面的方法和装置。特别地,在本发明的一些实施例中,视觉用户界面被设计为鼓励“自然语言第一”的输入,使得界面被配置为鼓励用户说出或以其他方式按照自然的方式提供输入到搜索系统。

一些实施例鼓励使用语音输入作为主要输入形态,以用户界面的视觉方面作为对语音输入的补充。但是,应当理解,可以说出的任何输入可以另选地经由另一类型的输入形态(例如,用键盘的文本输入)被提供。因此,尽管以下描述的实施例将语音的使用描述为输入形态,但是可以使用其他形态以允许用户提供和通过语音所提供的相同类型的下述实施例中描述的输入。

图1示出了用于根据本发明的一些实施例而使用的示例性系统100。系统100包括电子设备102,其可以是电视、计算机、便携式电子设备(诸如智能电话、或被配置为接收和显示安排的节目内容的任何其他可调谐电子设备)。电子设备102可被配置为从用户接收搜索和选择内容以在电子设备上查看的输入,其中使用一种或多种输入形态接收该输入。在一些实施例中,电子设备102包括语音输入接口104,诸如麦克风和被配置为接收输入的一个或多个其他输入接口106。其他输入接口106可以包括但不限于键盘接口(例如qwerty键盘)、鼠标接口、遥控接口、或使得用户能够搜索内容以在电子设备102上查看的任何其他合适的接口。

经由语音输入接口104接收的语音输入可以被发送到自动语音识别(asr)引擎108,用于自动语音识别以识别所接收语音输入的内容。尽管asr引擎108在图1中示出为被包括作为电子设备102的一部分,但是asr引擎108可以另选地从电子设备102远程地定位,并且可以使用任何合适的通信介质(例如一个或多个网络)而与电子设备102通信。在一些实施例中,电子设备102可与一个或多个本地asr引擎108以及一个或多个远程定位的asr引擎相关联,由此至少一些接收到的语音输入由所述一个或多个本地asr引擎处理,至少一些接收到的语音输入由所述一个或多个远程定位的asr引擎处理。这种分布式asr系统的例子是本领域技术人员已知的。使用一个或多个连接电子设备102和asr引擎的通信介质(例如一个或多个网络)被发送到所述一个或多个远程asr引擎用于识别的语音输入可以使用相同或不同的通信介质而从远程定位的asr引擎返回到电子设备102。

在一些实施例中,asr引擎108可以与存储一个或多个语音命令的一个或多个语音命令数据源110通信。asr引擎108可以将所接收的语音输入匹配到存储在所述一个或多个语音命令数据源110中的所述一个或多个语音命令,并返回一个或多个匹配的语音命令到一个或多个处理器114,处理器114被编程为执行对应于所述一个或多个匹配的语音命令的至少一个动作。在一些实施例中,asr引擎108的输出可以使用自然语言理解(nlu)引擎被分析,nlu引擎使用任何合适的基于nlu技术,其例子是本领域已知的。nlu输出可以至少部分地用于将语音命令与所接收的语音输入相关联。在一些实施例中,电子设备102可以被配置为响应于以下而将语音输入解译为语音命令:输入信号的激活(例如,用户按下遥控器或键盘上的按键),或者接收到对应于“唤醒”话语的语音输入,当对应于“唤醒”话语的语音输入被接收时指示跟随该输入信号的语音输入应当被解译为语音命令。另选地,语音输入可被解译为命令而不需要经由输入信号(例如按键按下或唤醒话语)的命令启动,因为本发明的实施例在这方面不受限制。

一个或多个语音命令数据源110所存储的语音命令的集合可以包括用于搜索和选择内容以在电子设备102上查看的任何合适的命令。在一些实施例中,语音命令的集合可以包括控制电子设备102本身的功能的命令,其例子包括在常规遥控设备上经常找到的命令,诸如“静音”、“打开电源”以及“音量”。下面的表1中示出了用于控制电子设备102的说明性的电子设备命令的集合,但应当理解的是,提供这些命令仅作为示例,这里所描述的实施例不限于使用这些特定的命令。

表1:说明性的电子设备命令

语音命令的集合还可以包括用于搜索和/或选择安排的节目内容以在电子设备102上显示的调谐器命令,诸如“示出<频道名称>、“下一频道”以及“示出<节目名称>”。下面的表2中示出了说明性的调谐器命令的集合,但应当理解的是,提供这些命令仅作为示例,这里所描述的实施例不限于使用这些特定的命令。

表2:说明性的调谐器命令

语音命令的集合可以还包括用于与电子设备102上的一个或多个客户端应用交互的应用命令,所述客户端应用执行许多功能中的任何功能,包括提供对许多服务的访问。例如,用户可使用应用命令以使用执行呼叫(例如skypetm)的客户端应用来启动语音呼叫会话、搜索天气信息、或执行许多其他动作中的任何动作。下面的表3中示出了说明性应用命令的集合。

表3:说明性的应用命令

在表3中所描述的说明性应用命令包括控制示例性客户端应用的命令,这些客户端应用包括twittertm、youtubetm、和skypetm。然而,应当理解,本发明的实施例可以包括用于任何其他客户端应用的语音命令,并且在这方面不受局限。例如,也可以包括用于包括但不限于gmailtmhulutm和myspacetm的客户端应用的语音命令。一些客户端应用(包括许多上面列出的那些)可以是可以要么经由电子设备上的专用应用要么经由设备上的web浏览器被访问的基于web的服务或应用,并且本发明的实施例不限制客户端应用被访问的方式。

语音命令的集合还可以包括动作命令,每个动作命令用于执行与搜索结果列表中的一个或多个项目有关的动作。下面的表4描述了说明性动作命令的列表。

表4:说明性的动作命令

在一些实施例中,语音命令的集合还可以包括用于与epg显示交互的epg命令。与使用和遥控设备一起使用的常规五向导航命令系统来限制用户通过epg条目的导航相反,epg命令的集合可以提供附加的语音功能性以增强用户的浏览体验。下面的表5描述了说明性的epg命令的集合。

表5:说明性的epg命令

在一些实施例中,电子设备102还包括调谐器112,调谐器112配置为使得电子设备102能够调谐到特定的频道以在电子设备102上显示安排的节目内容。例如,调谐器112可以使得电子设备能够从经由网络120连接到电子设备102的一个或多个安排的节目内容源124接收安排的节目内容。安排的节目内容源124可以寻找针对这些时间安排的媒体内容的来源,所述媒体内容包括但不限于存储的内容(例如电视节目和电影)和实况媒体内容。存储和/或传送安排的节目内容到电子设备(例如通过诸如有线或卫星网络的通信介质)的安排的节目内容源124是已知的。一些实施例可以包括被配置为从多个内容源接收安排的节目内容的调谐器,以及/或者可以包括多个调谐器,其每一个被配置为从不同内容源接收安排的节目内容。

电子设备102还可以包括网络接口118,其被配置为经由一个或多个网络120与一个或多个存储和/或处理设备通信。如上面所描述的,网络接口118可以用于传送语音输入到一个或多个远程asr引擎和从所述一个或多个asr引擎接收语音识别结果。电子设备102可以采用单个网络接口118或者多于一个的网络接口118,以使得电子设备102能够连接到多于一种类型的网络(例如以执行不同的功能)。

一种示例性电子设备102是电视系统。电视系统通常包括调谐器,其使得电视系统能够显示由连接到电视的机顶盒所接收的安排的节目内容。机顶盒是调谐器112的例子,其经由网络接口118接收安排的节目内容并解码所接收的内容以使得电子设备在显示器122上显示该内容。经由网络120接收到的安排的节目内容或任何其他内容可以在连接到电子设备102的显示器122上显示。在一些实施例中,显示器122可以集成作为电子设备102的部分,并且在其他实施例中,显示器122可以经由一个或多个有线或无线连接而连接到电子设备102。显示器122也可以是单个显示器或多个显示器,本发明的实施例在这方面不受限制。

在一些实施例中,电子设备102还可以与本地内容数据源116相关联,本地内容数据源116可以被配置为存储一个或多个电视节目、一个或多个电影、或任何其他适于在电子设备上回放的内容。例如,在一些实施例中,本地内容数据源116可以是数字视频录制器(dvr),其被配置为存储录制的安排的节目内容。本地内容数据源116可以被配置为存储和关联于电子设备102的一个或多个本地客户端应用有关的内容,所述本地客户端应用包括但不限于存储和/或管理图片文件、音乐文件和/或视频文件的一个或多个应用。

根据一些实施例,当搜索内容以在电子设备102上查看和/或回放时,可以从本地内容数据源116和/或从电子设备102远程定位、并通过网络120连接到电子设备102的一个或多个数据源(例如安排的内容数据源124、捆绑服务内容数据源124)检索内容。被搜索的特定源可以至少部分地取决于搜索查询。当从多个源返回结果时,搜索结果可以至少部分地基于与搜索结果相对应的内容的源而被排序。在一些实施例中,用户能够基于期望包括在搜索结果中的内容的源和/或内容的类型来限制对内容的搜索,如下面更详细地描述的。

一些实施例针对在显示器122上显示的语音可控视觉搜索界面,并且被配置为允许用户搜索内容以使用电子设备102进行查看和/或回放。用户能够与搜索界面进行交互来搜索安排的节目内容,如上面所描述的。安排的节目内容包括但不限于诸如电视和电台节目的广播内容。

另外,一些实施例可以使得用户能够搜索捆绑服务内容,捆绑服务内容例如由一个或多个连接网络的捆绑服务数据源124和/或本地内容数据源116存储。不同于只可以用于在特定时间(例如当该内容被安排用于广播时)查看的安排的节目内容,捆绑服务内容可以用于在任何时间查看/回放。捆绑服务内容可以包括但不限于来自基于web的服务的内容(例如)、来自存储媒体内容的本地或远程数据源的内容(例如dvr内容、来自服务提供商的点播内容等)、以及与关联于电子设备102的一个或多个客户端应用(例如)相关联的内容。如下面更加详细描述的,根据一些实施例的对内容的搜索可以允许用户在单个搜索中搜索安排的节目内容、捆绑服务内容、或者安排的节目内容和捆绑服务内容两者。

图2示出了根据本发明的一些实施例的用于处理搜索查询的示例性方法。在步骤210中,电子设备102接收对内容搜索以在电子设备102上查看和/或回放的搜索查询。例如,搜索查询可以包括一个或多个语音命令,如上面所描述的。为了将所接收的语音输入解译为一个或多个语音命令,语音输入可以由一个或多个本地和/或远程asr引擎处理用于识别。在一些实施例中,可以至少部分地基于语音输入的类型确定是经由本地asr引擎还是远程asr引擎或者经由这两者来处理语音输入。例如,在一个实现中,对应于固定形式设备命令(例如“静音”、“关闭电源”、“音量增加”)的语音输入可由本地asr引擎处理,而包括自由形式输入(例如“搜索”、“查找”等)的命令可由一个或多个远程定位的(例如“云”)asr引擎处理。例如,由于固定形式命令可以与有限的语法相关联,可以更容易识别它们,本地asr引擎可以足够用于语音识别并且和将输入发送到远程asr引擎相比更快。然而,自由形式的输入可能更难以识别,因此为了可接受的识别性能,可能需要将输入发送到更鲁棒的asr引擎。而且,与远程asr引擎相关联的语言模型可以定期地更新以便反映流行文化的变化,电影、演员、书籍的名称等,相反这些对于本地asr引擎可能是难以识别的。在一些实施例中,语音输入的至少第一部分可以由本地asr引擎处理,并且语音输入的至少第二部分可以由远程定位的asr引擎处理,而且本地和远程asr引擎的任何组合可以用来识别所接收的语音输入。

处理接着进入步骤220中,其中至少部分地基于所识别的对应于搜索查询的语音输入来搜索一个或多个数据源。所述一个或多个数据源可以以任何顺序被搜索,并且任何特定的数据源(包括少于全部的可用数据源)可以被搜索。由搜索返回的结果可以以任何合适的方式来确定。在一些实施例中,可以至少部分地基于用户想要执行的特定动作来确定搜索哪些数据源。例如,如果用户说“听bobseger”,则系统可以确定用户想要听音乐,因此只有本地音乐数据源而不是与epg相关联的数据源可以被搜索。另选地,如果用户说“观看modernfamily”,则可以确定用户想要观看电视秀。相应地,与epg相关联的数据源以及与录制的电视内容相关联的一个或多个数据源可以被搜索,但是本地音乐数据源可能不被搜索。通过选择性地搜索少于全部的可用数据源,本发明的一些实施例可以通过减少返回搜索结果的时间量而以更高效的方式返回相关的搜索结果。然而,并非所有的实施例被限制为只搜索可用源的子集,因为对于一些搜索可以搜索所有的可用源。

在一些实施例中,可以至少部分地基于将特定命令(或所确定的用户意图)与用于搜索和/或呈现搜索结果的特定顺序相关联的一个或多个规则来确定数据源被搜索的顺序和/或搜索结果被呈现的顺序。例如,如果用户说“观看modernfamily”,则对语音命令“观看”的识别(或预期动作,如果没有采用特定命令的话,如下面所讨论的)可以导致电子设备首先从与epg相关联的数据源搜索并返回结果,其次从与本地内容相关联的数据源搜索并返回结果,再次从与客户端应用(例如youtubetm)相关联的数据源搜索并返回结果。应当理解,描述这种用于搜索和返回与“观看”命令相关联的搜索结果的特定顺序仅仅是用于说明性目的,另选地可以使用任何其他所期望的顺序。

另外,一些实施例可以不包括固定命令语法,而是可以以一些其他方式从所接收的输入来确定用户的意图,诸如通过监测自由形式输入中的特定话语来确定用户的意图,并且响应于确定用户的意图来执行动作。例如,如果用户在自由形式输入中使用“播放”命令或使用“播放”一词,则系统可以识别出该播放命令或“播放”一词的使用可以暗示用户访问总是可访问的内容(要么本地存储的要么点播可用的)的意图。可以使用一个或多个优先级规则来确定播放什么媒体内容。例如,可以首先确定epg是否具有与语音输入相匹配的当前可用于播放的任何媒体内容(例如广播内容、点播内容等)。如果从epg确定没有当前可用的内容,则接下来可以确定是否有任何录制的媒体内容(例如dvr内容)与语音输入匹配。如果多于一个的录制媒体内容段与语音输入相匹配,则所述一个或多个优先级规则可以指定所有匹配的内容被显示,使得用户可以在其中选择。另选地,在一些实施例中,电子设备可以自动回放匹配内容的所选择的一个(例如最旧未观看(或部分观看)的录制的内容被选择并在电子设备上回放),而不是向用户显示多个搜索结果。尽管上述示例涉及使用特定优先级规则的集合来播放媒体内容,但是应当理解,这些规则只是说明性的,可以使用任何合适的优先级规则的集合以用于任何语音输入,因为本发明的实施例在这方面并不受限。

回到图2的处理,在步骤220中已经搜索了所述一个或多个数据源之后,处理进入步骤222,其中响应于从所述一个或多个数据源搜索到与搜索查询相匹配的内容,在与电子设备102相关联的用户界面上显示一个或多个结果。搜索结果可以以任何合适的方式显示,包括使用语音使能(voice-enabled)的搜索结果界面,如下面将更详细地描述的。如上面所描述的,显示结果可以包括直接呈现与用户输入相匹配的内容段。

图3示出了根据本发明的一些实施例的视觉搜索界面的部分。具体地,图3示出了说明性的结果屏幕300,用于显示从用户启动的对在电子设备上查看和/或播放的内容的搜索返回的搜索结果。在一些实施例中,结果屏幕300被配置为沿着至少两个轴显示搜索结果。在一个说明性实施例中,一个轴在搜索界面的前景中,并且一个或多个其他轴在搜索界面的背景中,但是可以响应于命令(例如语音命令)而被带到搜索界面的前景。在再一些其他实施例中,仅在前景中的轴上显示的内容完全聚焦(infocus),并且其他轴部分地脱焦(outoffocus)以将用户的注意力吸引到前景轴。然而,并非使用前景和背景轴的所有实施例在这方面受限制,因为一些实施例可以呈现两个或更多个轴完全聚焦。

在一些实施例中,用于显示搜索结果的第一轴可以是与时间无关的轴310。当对应于搜索结果的内容可用于查看和/或回放时,可以使用任何合适的与时间无关的度量来沿着与时间无关的轴310来排序搜索结果。例如,在一个非限制性的示例中,可以至少部分地基于与产生结果的搜索查询的相关度来沿着与时间无关的轴来排序搜索结果。在一些实施例中,沿着与时间无关的轴显示的内容可以被限制为在当前时间可用的内容,而在其他实施例中,其可以包括当前不可用的内容。对于基于与搜索查询的相关度来排序所返回的搜索结果的实施例,可以以任何合适的方式使用任何合适的算法(例如,包括对当前可用于查看的内容给出较高的相关度)来确定相关度,因为本发明的实施例在这方面不受限制。应当理解的是,与搜索查询的相关度仅是沿着与时间无关的轴对结果进行排序的一种方式,并且任何其他合适的度量可以被用来代替或加之于与搜索查询的相关度来使用。例如,可以至少部分地基于内容的类型、内容的源或任何其他因素或者因素的组合来对搜索结果进行排序。

在一些实施例中,搜索结果也可以沿着第二轴被组织,第二轴是基于时间的并且被配置为显示可用于在不同时间查看的搜索结果。例如,结果屏幕300的前景可以显示用于当前可用内容的搜索结果,而仅在将来时间可用的内容可以显示在背景320中,如图3所示。

尽管结果屏幕300包括显示在仅两个轴上的搜索结果,但是应当理解,搜索结果可以显示在任何数目的轴上,因为本发明的实施例在这方面不受限制。例如,在一些实施例中,用于在当前时间可用、但在查看内容之前可能需要支付订阅费或一些其他费用的捆绑服务内容的搜索结果可以沿着单独的轴(未示出)显示,以指示该内容仅在已经支付可适用的付款之后才可以被查看。

结果屏幕300还可以包括描述部分330,其包括关于当前选择的搜索结果的信息。描述部分330还可以包括其他信息,其他信息使得用户能够从在结果屏幕300上显示的搜索结果中做出明智的选择。例如,描述部分330可以包括与当前所选择的搜索结果相关联的内容的描述,并且该描述可以基于对在结果屏幕300上显示的不同搜索结果的选择而改变。

在一些实施例中,比从搜索处理返回的全部搜索结果少的搜索结果可以显示在结果屏幕300上以使显示的拥挤最小化。在一些实施例中,用户可以与一个或多个语音标签交互(如下面更详细描述的),以查看另外的搜索结果。结果屏幕300还可以包括发现字段340,其使得用户能够基于在结果屏幕300上显示的搜索结果中的一个或多个而进行附加的搜索。例如,发现字段340当由用户选择时,可以启动对和关联于当前所选择的搜索结果的内容相似的内容的搜索。相似度可以用任何合适的使用任何合适的算法的方法来确定,因为本发明的实施例在这方面不受限制。例如,至少部分地基于内容所检索自的内容源、与内容段相关联的一个或多个内容标签(例如电影的家长分级)、内容的类型、或者这些或其他因素的任何组合来确定相似度。

在一些实施例中,结果屏幕300可以包括工具条350,其包括便利于与搜索屏幕300的用户交互的信息。例如,工具条350可以包括一个或多个图标、文本或其他指示器,所述其他指示器解释用户可用于与结果屏幕300交互的特定于屏幕的或全局的输入(例如语音命令)。

根据本发明的一些实施例,搜索结果可以包括混合的搜索结果,其包括不同类型的内容。例如,如上面所讨论的,搜索结果可以包括与安排的节目内容和捆绑服务内容相对应的结果。图4示出了说明性的结果屏幕400,其中在结果屏幕400上显示的搜索结果包括混合的搜索结果,即,搜索结果中的至少两个与不同类型的内容相关联。混合的搜索结果可以包括从一个或多个安排的节目内容数据源返回的第一结果和从一个或多个捆绑服务内容数据源返回的第二结果。在结果屏幕400上显示的搜索结果包括搜索结果410、412和414,它们可以是从一个或多个安排的节目内容数据源返回的结果,还包括搜索结果420和422,它们可以是从一个或多个捆绑服务内容数据源返回的结果。

如图4所示,从安排的节目内容数据源返回的搜索结果和从捆绑服务内容数据源返回的搜索结果可以混合在一起并且使用任何合适的度量或度量的组合沿着与时间无关的轴排序,这些度量包括但不限于与搜索查询的相关度、内容的类型和内容的源。与结果屏幕300一样,结果屏幕400可以包括描述部分430,其包括和在结果屏幕400上显示的搜索结果中的一个或多个有关的信息。

在一些实施例中,在结果屏幕400上显示的搜索结果可以沿着包括与时间无关的轴和基于时间的轴的至少两个轴被排序。在一些实施例中,在搜索界面的背景部分中显示的搜索结果可以仅包括安排的节目内容而不包括捆绑服务内容。例如,因为一些捆绑服务内容可以总是可访问的,在一些实施例中,对应于这样的捆绑服务内容的搜索结果可以总是显示在搜索界面的前景部分中,以指示其可用于立即的查看和/或播放。然而,应当理解,这仅仅是使用两个轴来组织内容的一个说明性的方式,内容的其他组织也是可能的。

如上面所讨论的,一些捆绑服务内容只有一经支付费用才可以立即被访问。例如,来自在线音乐商店(诸如)的歌曲只有一经购买该歌曲才可以立即被访问。在一些实施例中,尽管在图4中未示出,与在变得可用于在电子设备上查看和/或回放之前需要支付的内容相对应的搜索结果可能不与其他搜索结果混合,而是可以出现在搜索结果界面的不同部分中。

在一些实施例中,根据本发明的一些实施例的搜索界面可以包括一个或多个选择标签,这些标签便利于用户与搜索界面的一个或多个组件之间的交互。图5示出了包括多个选择标签的示例性的结果屏幕500。如图5所示,搜索结果中的一个或多个可以与选择标签510相关联,其指示用户可提供(例如经由口语输入、键盘或小键盘等)以选择特定的搜索结果的输入。在示例性的结果屏幕500中,对于采用语音接口的实施例,如果用户想要选择左下角中的第一搜索结果,则用户可以说“选择1”。另选地,如果用户想要选择显示在右下角上的搜索结果,则用户可以说“选择4”。

结果屏幕500还可以包括其他类型的选择标签,诸如一个或多个图标520,其使得用户能够使用选择命令来执行与关联于该图标的内容有关的一个或多个动作。例如,图标520可以包括但不限于向用户指示它们可以查看特定内容、录制特定内容、或执行与关联于图标的特定内容相关联的一些其他动作的图标。用户可以将动作与选择标签的标识相组合来执行对所选择内容的动作。例如,用户可以通过说“查看1”来查看与在图5的左下角中的搜索结果相关联的内容。

在一些采用语音接口的实施例中,取决于语音命令何时是激活的,与视觉搜索界面的语音交互可以被归类为不同类型的语音命令。例如,一些语音命令可以被分类为与屏幕无关的命令,这些命令独立于在任何特定屏幕上显示的内容,并且总是激活的而不管当前正在显示器上呈现的是什么特定屏幕。与屏幕无关的命令的一些非限制性实例包括但不限于诸如音量控制、频道控制、屏幕亮度和菜单访问命令的命令。在一些实施例中,与屏幕无关的命令的集合和常规上由遥控设备控制的功能性基本上重叠。与屏幕无关的命令可以与一个或多个标记相关联,所述标记是用于在搜索界面上显示、以向用户提醒这些命令的存在的选择标签的,或者在一些实施例中,假设用户知道这些总是可用的命令并且可以被调用,使得不显示选择标签或图标。在一些实施例中,在搜索界面屏幕上显示的工具条中可以包括用于全局命令中的一个或多个的图标以及/或者响应于触发事件(诸如求助、按下输入设备上的热键或者以一些其他的方式)可以访问全局命令的列表。

一些语音交互可以关联于与屏幕相关的动作,与屏幕相关的动作使得用户能够只在用户界面的特定屏幕内执行动作。例如,在图5所示的结果屏幕500中,选择标签510可以允许用户选择特定的搜索结果(如上面所描述的),并且响应于选择了特定的搜索结果,与所选择的搜索结果相关联的内容的描述可以在搜索界面上被更新以向用户提供信息,该信息可以帮助用户决定是否对与所选择的搜索结果相关联的内容执行动作(例如观看、购买、录制)。

其他与屏幕相关的动作可以与搜索界面的一个或多个导航功能相关联,导航功能使得用户能够在特定的结果屏幕内导航以及/或者更新结果屏幕的内容。例如,搜索界面可以显示语音使能(voice-enabled)的标记,其允许用户查看当前不在搜索界面上显示的附加的搜索结果,例如通过说出“下一结果”或一些其他命令短语或自由形式的输入来更新结果屏幕以包括附加的结果。

搜索界面可以进一步配置有关联于与屏幕相关的动作的用户交互功能性,以允许用户在以多轴显示的不同水平呈现的搜索结果之间切换。例如,在搜索结果沿着与时间无关的轴和基于时间的轴显示的实施例中,用户可以使用语音(或其他形式的)输入以切换沿着基于时间的轴的哪些结果当前被聚焦并且可以被选择。例如,用户可以说“稍后”(或一些其他话语或短语)以选择与在用户界面的背景中沿着所显示搜索结果的基于时间的轴显示的搜索结果相关联的内容。这可以是有用的,例如,允许用户采取和在稍后的时间可用的安排节目内容有关的动作(例如录制)。为了执行该动作,用户可以说“稍后”(或一些其他话语或短语),这可以切换在前景中所显示的搜索结果和在背景中所显示的搜索结果,以使得用户能够选择内容只在将来可用的项目。

图形图标520可以表示另一种类的用户交互,这些用户交互使得用户能够执行特定的动作,诸如录制、查看或回放与搜索结果相关联的内容。在一些实施例中,图形图标也可以对应于附加的增值动作,这些增值动作使得用户能够执行其他“次要”的功能,例如发帖子到执行twittertm上的动作、或与另一客户端应用服务或网站进行交互。

虽然上述说明性的例子讨论了三种不同类型的用户交互(即与屏幕无关的命令、与屏幕相关的动作以及图形图标动作),但应当清楚,可以使用任何数目类型的用户交互,因为本发明的实施例在这方面不受限制。

在一些支持语音接口的实施例中,在搜索界面上显示的选择标签和/或其他图标的存在或不存在可以至少部分地基于是否已激活语音交互以用于搜索界面来确定。确定语音交互是否激活以用于搜索界面可以以任何合适的方式进行,包括例如确定麦克风是否激活、确定语音识别软件是否在电子设备上执行、确定用户是否已经发出语音命令以在搜索界面上显示语音标签、或者其他合适的方式。

在一些实施例中,电子设备可以接收使得电子设备进入“监听模式”的输入,在“监听模式”期间电子设备期待来自用户的进一步输入以执行动作。相反,当电子设备不处于监听模式时,电子设备默认地可以不将所接收的输入解译为表示用户的执行特定动作的意图,而是可以正在监测触发进入到监听模式的输入。图6示出了根据本发明的一些实施例的用于包括监听模式的电子设备的说明性处理。在操作610中,确定是否已经接收到将使得电子设备进入监听模式的第一输入。例如,在包括语音接口的实施例中,第一输入可以与证明用户的执行动作的意图的语音命令或一些其他语音输入相对应,如上面所描述的。另选地,第一输入可以是使得电子设备进入监听模式的任何其他合适的输入,包括但不限于按下键盘或小键盘上的特定按键。

如果在步骤610中确定没有接收到第一输入,则处理继续监测接收到的第一输入。否则,如果已经接收到第一输入,则处理进入步骤612,其中响应于识别第一输入使得电子设备进入监听模式。在处于监听模式时,处理进入步骤614,其中确定是否已接收到第二输入。如果确定在监听模式中已经接收到第二输入,则处理进入步骤620,其中执行对应于第一和/或第二输入的一个或多个动作。在从步骤620中执行了一个或多个动作后,如果期待附加的输入,则处理可以可选地返回到步骤612以进入监听模式。例如,第二输入可以是“今晚的hbo喜剧清单上有什么?”,并且在步骤620中执行的动作可以是打开当天的hbo喜剧清单。因为期待附加的输入,所有处理可以进入步骤612以进入监听模式,等待附加的输入(例如下一个、前一个、退出等)。然而,如果在从步骤620中执行一个或多个动作之后没有附加的输入被预期,则处理可以结束。

如果在步骤614中确定没有接收到第二输入,则处理进入步骤616,其中确定自从进入监听模式是否已经经过了特定的时间量(例如5秒)。如果在步骤616中确定还没有经过特定的时间量,则处理继续监测第二输入。否则,如果确定已经过去了特定的时间量,则处理进入步骤618,其中使得电子设备退出监听模式,并且处理返回到步骤610以监测第一输入。在上面描述的实施例中,在进入监听模式后,电子设备在已经过去了特定的时间量之后退出监听模式。然而,应当清楚,在一些实施例中,可以以其他方式另选地退出监听模式。例如,一些实施例可以使得用户能够通过提供指引电子设备退出监听模式的输入来显式地退出监听模式。该显式的输入可以采取任何适合的形式,包括但不限于语音命令(或确定的用户意图)、或者按下键盘或小键盘上的按键。

在一些实施例中,当使得电子设备进入监听模式时,这可以在电子设备所显示的用户界面上以某种方式被注意到。例如,一经进入监听模式,一个或多个选择标签和/或图标可以出现在用户界面上以通知用户已经进入收听模式。应当理解,可以以任何方式执行反映电子设备的模式状态的用户界面变化,显示或隐藏选择标签和/或图标的例子只是指示状态的一种方式,并且其他方式也是可行的。

在一些实施例中,可以分层级地表示捆绑服务内容搜索结果。例如,如果特定的捆绑服务包括一个或多个与搜索查询相匹配的内容段,则可以最初通过在搜索结果中包括捆绑服务的标识符而不是对应的内容段来表示它们,并且接着从搜索结果中选择捆绑服务可以使得对应的内容段示出在用户界面上。例如,与捆绑服务内容搜索结果相关联的应用可以示出为用于应用的图像或图标,该图像或图标被用户识别为表示该应用。例如,捆绑服务搜索结果可以对应于电影流处理(streaming)服务,诸如(例如由图标示出),并且响应于通过例如说出选择第二搜索结果(例如搜索结果)的“选择2”而选择电影流处理服务,可以显示应用内的搜索结果。

在说明性的例子中,用户可以搜索对应于“yankees”的内容,响应于该搜索所返回的搜索结果可以包括用于newyorkyankees棒球赛的安排的节目内容、来自用于和newyorkyankees有关的电影的电影流处理服务的捆绑服务内容、与乐队“damnyankees”有关的音乐内容、以及用于marktwain的电子图书“aconnecticutyankeeinkingarthur’scourt”的电子图书内容。与显示捆绑服务所包括的、与yankees有关的所有电影相反,搜索结果可以最初示出用于电影流处理服务的图像,该电影流处理服务包括与搜索项“yankees”有关的多个电影。一经通过使用例如与该图像相关联的选择语音标签而选择用于该电影流处理服务的图像,从该流处理服务可用并对应于搜索项“yankees”的一部或多部电影可以显示在搜索结果中。分层级呈现的搜索结果可以具有任何数目的分层级的水平,因为本发明的实施例在这方面不受限制。

另一个可以分层级表示的内容的说明性实例是音乐库中的歌曲。例如,用户可能想要播放metallica的歌曲,但可能不记得该歌曲的名称。为了搜索该歌曲,用户可以启动对“metallica”的搜索,所返回的搜索结果可以包括本地存储在与电子设备相关联的本地数据源上的多个metallica的专辑,以及/或者包括来自metallica的音乐的一个或多个网络连接的音乐数据源(例如数据库)。在一些实施例中,搜索结果可以呈现为用于metallica不同专辑的专辑封面的一系列图像,并且可以提示用户从搜索结果中选择专辑中的一张(例如通过使用与每个专辑图像相关联的选择语音标签)。一经选择专辑中的一张,所选择的专辑可以展开以展示对于与专辑相关联的歌曲中的一首或多首的搜索结果,并且用户可以选择专辑上的歌曲之一进行回放。因此,在这方面,搜索结果可以以分层级的方式呈现,使得对搜索结果的顺序选择可以允许用户导航通过搜索结果以辨识用户想要在电子设备上回放的内容。

在一些实施例中,可以采用指引用户如何与用户界面的不同组件交互的语音标签。内容中立的语音标签是与语音标签所标识的内容无关的标记。内容中立的语音标签的例子是图5中所示的选择语音标签(1,2,3,4),它们允许用户选择搜索结果之一而不必说出标识搜索结果的内容的名称。因此,内容中立的语音标签不标识与它们相关联的内容本身,而是仅仅标识内容被分配到的搜索结果的空档(slot)或位置。通过使用内容中立的语音标签,向用户提供了语音标签的集合,它们有利于当与视觉搜索界面交互时的一致的用户体验。另外,使用内容中立的语音标签允许用户使用相比在语音标签是至少部分地基于该标签所标识的内容而创建的情况下将需要的更少的语音来调用命令。使用内容中立的语音标签还允许使用固定的语法(例如数字、字母),这可以针对可能具有唯一的名称等的内容产生更精确的asr。

在一些实施例中,用户能够提供引起多于一种类型的命令或交互的激活的输入(例如经由语音)。例如,用户可以说“观看1”。作为响应,发生两个交互:(1)搜索结果中的第一项目可以被选择和(2)所选择的项目可以被播放。这样,单个输入可导致多个命令或交互被执行而无需用户必须发出单独的命令。这种系统使得用户能够使用自然输入(例如语音)以控制电子设备。

上面描述了可以针对任何类型的内容执行的搜索,包括对youtubetm、hulutm或任何其他视频共享网站或web服务上的视频剪辑的搜索。另外,如上所述,用户可以搜索本地存储在一个音乐库中或可经由网络(例如因特网)访问的音乐内容。用户可以具有将搜索限制于特定类型的内容(诸如音乐、视频或安排的节目内容)的能力,使得搜索结果只包括用户期望搜索的特定类型的内容。为此,搜索界面可以与高级搜索能力相关联,高级搜索能力可使用语音输入和/或其他输入形态被配置。

在一些实施例中,在搜索结果中显示的内容段可以包括多个标签(例如语音标签),其中一个标签标识内容,另一标签指示用内容执行的动作(例如观看、录制或购买内容)。对于搜索界面,与搜索结果相关联的标签的数量不是本发明实施例的限制。

图7示出了可与本文所描述发明的任何实施例结合使用的计算机系统700的说明性的实现。计算机系统700可以包括一个或多个处理器710和一个或多个计算机可读非易失性存储介质(例如存储器720和一个或多个非易失性存储介质730)。处理器710可以以任何适当的方式对向存储器720和非易失性存储设备730写数据以及从它们读取数据进行控制,因为本文所描述的本发明的各方面在这一点上并不受限制。为了执行本文所描述的任何功能性,处理器710可以执行存储在一个或多个计算机可读存储介质(例如存储器720)中的一个或多个指令,所述一个或多个计算机可读存储介质可充当用于存储由处理器710执行的指令的非易失性计算机可读存储介质。

本发明的上述实施例可以用多种方式中的任何一种来实现。例如,实施例可以使用硬件、软件或其组合来实现。当用软件实现时,软件代码可以在任何合适的处理器或处理器集上执行,无论是设置在单个计算机中还是分布在多个计算机之间。应当理解,执行上述功能的任何组件或组件集可以一般地被视为是控制上述功能的一个或多个控制器。所述一个或多个控制器可以以多种方式实现,诸如用使用微代码或软件被编程以执行上述功能的通用硬件(例如一个或多个处理器)或专用硬件。

在这方面,应当清楚,本发明的实施例的一个实现包括至少一个非易失性计算机可读存储介质(例如计算机存储器、软盘、光盘、磁带等),其用计算机程序(即多个指令)编码,当所述计算机程序在处理器上执行时,执行本发明的实施例的上述功能。计算机可读存储介质可以是可传送的,使得其上所存储的程序可被加载到任何计算机资源上以实现本文所讨论的本发明的各方面。此外,应当理解,所参考的当被执行时执行上述功能计算机程序不局限于在主机计算机上运行的应用程序。相反,在此使用术语计算机程序以在一般意义上指可被用于编程处理器以实现本发明的上述各方面的任何类型的计算机代码(例如软件或微代码)。

本发明的各种方面可以单独使用、组合使用或者以未在前述实施例中具体讨论的多种多样的布置来使用,因此本发明的各种方面并不将它们的应用限制于在上述说明中所阐述的或在附图中所描述的组件的布置和细节。例如,一个实施例中所描述的各方面可以以任何方式与其他实施例中所描述的各方面相组合。

而且,本发明的实施例可以实现为一个或多个方法,已经提供了其示例。作为方法的部分所执行的动作可以以任何合适的方式来排序。因此,可以构造在其中以与所示的顺序不同的顺序来执行动作的实施例,其可包括同时执行一些动作,即使在说明性实施例中被示出为顺序动作。

在权利要求中使用诸如“第一”、“第二”“第三”等的序数词来修改权利要求元素本身并不意味着一个权利要求要素相对于另一权利要求要素的任何顺序、先后次序或优先,也不意味着方法的动作被执行的时间顺序。这些术语仅用作标记来区分具有某一名称的一个权利要求要素与具有相同名称(除使用序数词外)的另一个要素。

在此使用的措辞和术语用于描述的目的,不应被视为是限制。在此使用的“包括”、“包含”、“具有”“包含”“涉及”及其变型意在包括其后列出的项目及另外的项目。

已经详细描述了本发明的几个实施例,本领域的技术人员可容易地想到各种修改和改进。这些修改和改进旨在属于本发明的精神和范围。因此,上述说明书仅仅是示例性的,而非旨在限制。本发明仅被限制为如权利要求及其等同物所限定的那样。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1