用于媒体回放的虚拟助理的制作方法

文档序号：13518290阅读：147来源：国知局

相关申请的交叉引用本申请要求来自于2015年6月29日提交的标题为“virtualassistantformediaplayback”的美国临时专利申请序列号62/186,182以及于2015年8月5日提交的标题为“virtualassistantformediaplayback”的美国专利申请序列号14/819,343的优先权，这两个专利申请的内容出于任何目的据此全文以引用方式并入本文。本公开整体涉及媒体回放，并且更具体地讲，涉及用于促进媒体回放的虚拟助理。
背景技术：
：：智能自动化助理(或数字助理)在人类用户与电子设备之间提供有利界面。此类助理允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如，用户可通过向与电子设备相关联的数字助理提供语音用户请求来访问电子设备的服务。数字助理可根据该语音用户请求解译用户的意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务，并且可将相关输出以自然语言形式返回给用户。当管理音乐或其他媒体时，数字助理可有助于回放特定媒体，特别是在免持环境中。数字助理可有效地对用于播放特定媒体项(诸如根据标题或根据艺术家具体确定的专辑或歌曲)的请求做出响应。然而，数字助理尚不用于基于非特定非结构化的自然语言请求—例如，对来自流行电影的歌曲的请求来发现媒体。技术实现要素：然而，用于基于非特定非结构化的自然语言请求来发现媒体的一些技术通常是麻烦且低效的。例如，现有技术使用复杂且耗时的用户界面，该用户界面可包括多次按键或击键。用户必须执行他或她自己的研究，以确定他或她正在寻找哪个特定媒体，然后尝试获得该媒体。这些步骤在某些情况下均可是不实际的或不可能的，诸如当用户正操作机动车辆或者他或她忙得不可开交时。现有技术需要比所需更多的时间，从而浪费了用户的时间和设备能量。后一种考虑在电池驱动的设备中特别重要。因此，需要具有用于基于非特定非结构化的自然语言请求来发现媒体的更快、更有效的方法和界面的电子设备。此类方法和界面任选地补充或替换用于基于非特定非结构化的自然语言请求来发现媒体的其他方法。此类方法和界面减少对用户所造成的认知负担，并且产生更有效的人机界面。对于电池驱动的计算设备，此类方法和界面节省功率并且增加电池两次充电之间的间隔。在一些实施方案中，用于确定媒体的方法包括：在具有一个或多个处理器、存储器和麦克风的设备上：接收与对媒体的请求相关联的用户输入，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；识别与用户输入相关联的至少一个上下文；基于该至少一个上下文和用户输入引发对媒体的搜索；基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项；并且根据确定该至少一个媒体项满足请求，获得该至少一个媒体项。在一些实施方案中，电子设备包括：显示器；存储器；麦克风；耦接至显示器、存储器和麦克风的处理器；处理器被配置为：接收与对媒体的请求相关联的用户输入，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；识别与用户输入相关联的至少一个上下文；基于该至少一个上下文和用户输入引发对媒体的搜索；基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项；并且根据确定该至少一个媒体项满足请求，获得该至少一个媒体项。在一些实施方案中，非暂态计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当由电子设备执行时，使得电子设备：接收与对媒体的请求相关联的用户输入，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；识别与用户输入相关联的至少一个上下文；基于该至少一个上下文和用户输入引发对媒体的搜索；基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项；并且根据确定该至少一个媒体项满足请求，获得该至少一个媒体项。在一些实施方案中，暂态计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当由电子设备执行时，使得电子设备：接收与对媒体的请求相关联的用户输入，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；识别与用户输入相关联的至少一个上下文；基于该至少一个上下文和用户输入引发对媒体的搜索；基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项；并且根据确定该至少一个媒体项满足请求，获得该至少一个媒体项。在一些实施方案中，系统利用具有显示器的电子设备，其中系统包括：用于接收与对媒体的请求相关联的用户输入的装置，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；用于识别与用户输入相关联的至少一个上下文的装置；用于基于该至少一个上下文和用户输入引发对媒体的搜索的装置；用于基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项的装置；并且根据确定该至少一个媒体项满足请求，用于获得该至少一个媒体项的装置。在一些实施方案中，电子设备包括：包括接收单元、识别单元、引发单元、确定单元和获得单元的处理单元，该处理单元被配置为：使用接收单元接收与对媒体的请求相关联的用户输入，该用户输入包括非结构化的自然语言语音，该自然语言语音包括一个或多个字词；使用识别单元识别与用户输入相关联的至少一个上下文；使用引发单元基于该至少一个上下文和用户输入来引发对媒体的搜索；使用确定单元基于该至少一个上下文和用户输入确定满足请求的至少一个媒体项；并且根据确定该至少一个媒体项满足请求，使用获得单元获得该至少一个媒体项。用于执行这些功能的可执行指令任选地被包括在被配置用于由一个或多个处理器执行的非暂态计算机可读存储介质或其他计算机程序产品中。用于执行这些功能的可执行指令任选地被包括在被配置用于由一个或多个处理器执行的暂态计算机可读存储介质或其他计算机程序产品中。因此，为设备提供用于基于非特定非结构化的自然语言请求来发现媒体的更快、更有效的方法和界面，由此提高此类设备的有效性、效率和用户满意度。此类方法和界面可补充或替换用于基于非特定非结构化的自然语言请求来发现媒体的其他方法。附图说明为了更好地理解本发明的各种所描述的实施方案，应该结合以下附图参考下面的具体实施方式，在附图中，类似的附图标号在所有附图中指示对应的部分。图1是示出根据各种示例的用于实现数字助理的系统和环境的框图。图2a是示出根据各种示例的实现数字助理的客户端侧部分的便携式多功能设备的框图。图2b是示出根据各种示例的用于事件处理的示例性部件的框图。图3示出了根据各种示例的实现数字助理的客户端侧部分的便携式多功能设备。图4是根据各种示例的具有显示器和触敏表面的示例性多功能设备的框图。图5a示出了根据各种示例的便携式多功能设备上的应用程序菜单的示例性用户界面。图5b示出了根据各种示例的具有与显示器分开的触敏表面的多功能设备的示例性用户界面。图6a示出了根据各种示例的个人电子设备。图6b是示出根据各种示例的个人电子设备的框图。图7a是示出根据各种示例的数字助理系统或其服务器部分的框图。图7b示出了根据各种示例的图7a所示的数字助理的功能。图7c示出了根据各种示例的知识本体的一部分。图8a至图8q示出了根据一些实施方案的个人电子设备的示例性用户界面。图8i被有意地省略以避免大写字母i与数字1(一)之间的任何混淆，并且图8o被有意地省略以避免大写字母o和数字0(零)之间的任何混淆。图9a至图9c示出了根据各种示例的用于操作用于媒体回放的数字助理的过程。图10示出了根据各种示例的电子设备的功能框图。具体实施方式以下描述阐述了示例性方法、参数等。然而，应当认识到，此类描述并非旨在限制本公开的范围，而是作为对示例性实施方案的描述来提供。需要提供用于基于非特定非结构化的自然语言请求来发现媒体的更有效的方法和界面的电子设备。如上文所述，媒体发现技术不如其可能的那样有效，诸如就具有慢的或不寻常的语音模式的用户而言。数字助理可减少对基于非特定非结构化的自然语言请求发现媒体的用户所造成的认知负担，从而提高生产力。此外，此类技术可减少本来浪费在冗余用户输入上的处理器功率和电池功率。下面，图1、图2a至图2b、图3、图4、图5a至图5b和图6a至图6b提供了对用于执行用于基于非特定非结构化的自然语言请求来发现媒体的技术的示例性设备的描述。图6a至图6b示出了用于基于非特定非结构化的自然语言请求来发现媒体的示例性用户界面。图7a至图7c是示出数字助理系统或其服务器部分以及与数字助理系统相关联的知识本体的一部分的框图。图8a至图8b是示出根据一些实施方案的基于非特定非结构化的自然语言请求来发现媒体的方法的流程图。尽管以下描述使用术语“第一”、“第二”等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一个元素与另一元素区分开。例如，第一触摸可被命名为第二触摸并且类似地第二触摸可被命名为第一触摸，而不脱离各种所述实施方案的范围。第一触摸和第二触摸两者都是触摸，但是它们不是同一触摸。在本文中对各种所述实施方案的描述中所使用的术语只是为了描述特定实施方案的目的，而并非旨在进行限制。如在对各种所述实施方案中的描述和所附权利要求书中所使用的那样，单数形式“一个”(“a”、“an”)和“该”旨在也包括复数形式，除非上下文另外明确地指示。还应当理解，本文中所使用的术语“和/或”是指并且涵盖相关联地列出的项目中的一个或多个项目的任何和全部可能的组合。还将理解的是，术语“包括”(“includes”“including”“comprises”和/或“comprising”)当在本说明书中使用时指定存在所陈述的特征、整数、步骤、操作、元素、和/或部件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元素、部件、和/或其分组。根据上下文，术语“如果”可被解释为意指“当...时”或“在...时”或“响应于确定...”或“响应于检测到...”。类似地，根据上下文，短语“如果确定...”或“如果检测到[所陈述的条件或事件]”可以、被解释为意指“在确定...时”或“响应于确定...”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。本文描述了电子设备、此类设备的用户界面和使用此类设备的相关联的过程的实施方案。在一些实施方案中，该设备为还包含其他功能诸如pda和/或音乐播放器功能的便携式通信设备，诸如移动电话。便携式多功能设备的示例性实施方案包括但不限于来自appleinc.(cupertino,california)的设备、ipod设备、和设备。任选地使用其他便携式电子设备，诸如具有触敏表面(例如，触摸屏显示器和/或触控板)的膝上型电脑或平板电脑。还应当理解，在一些实施方案中，设备并非便携式通信设备，而是具有触敏表面(例如，触摸屏显示器和/或触控板)的台式计算机。在下面的讨论中，描述了一种包括显示器和触敏表面的电子设备。然而，应当理解，该电子设备任选地包括一个或多个其他物理用户接口设备，诸如物理键盘、鼠标和/或操纵杆。设备可支持多种应用程序，诸如以下应用程序中的一个或多个应用程序：绘图应用程序、呈现应用程序、文字处理应用程序、网站创建应用程序、盘编辑应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息应用程序、健身支持应用程序、照片管理应用程序、数字相机应用程序、数字视频相机应用程序、web浏览应用程序、数字音乐播放器应用程序、和/或数字视频播放器应用程序。在设备上执行的各种应用程序任选地使用至少一个通用的物理用户界面设备，诸如触敏表面。触敏表面的一种或多种功能以及被显示在设备上的对应信息任选地对于不同应用程序被调整和/或变化，和/或在相应应用程序内被调整和/或变化。这样，设备的共用物理架构(诸如触敏表面)任选地利用对于用户而言直观且清楚的用户界面来支持各种应用。图1示出了根据各种示例的系统100的框图。在一些示例中，系统100可实现数字助理。术语“数字助理”、“虚拟助理”、“智能自动化助理”或“自动数字助理”可指解译语音形式和/或文本形式的自然语言输入以推断用户意图并且基于推断出的用户意图来执行动作的任何信息处理系统。例如，为了根据推断出的用户意图来采取行动，系统可执行以下内容中的一者或多者：利用被设计用于实现所推断出的用户意图的步骤和参数来识别任务流；将来自推断出的用户意图的具体要求输入到任务流中；通过调用程序、方法、服务、api等来执行任务流；以及生成对用户的听觉(例如，语音)和/或视觉形式的输出响应。具体地，数字助理可能够接受至少部分地为自然语言命令、请求、声明、讲述和/或询问的形式的用户请求。通常，用户请求可寻求数字助理作出信息性回答，或寻求数字助理执行任务。针对用户请求的令人满意的响应可以是提供所请求的信息性回答、执行所请求的任务，或这两者的组合。例如，用户可向数字助理提出问题，诸如“我现在在哪里？”基于用户的当前位置，数字助理可回答“您在中央公园西门附近。”用户还可请求执行任务，例如“请邀请我的朋友下周来参加我女朋友的生日聚会。”作为响应，数字助理可通过讲出“好的，马上”来确认请求，并然后代表用户将合适的日历邀请发送至用户的电子通讯录中列出的用户朋友中的每个朋友。在执行所请求的任务期间，数字助理有时可在很长时间段内在涉及多次信息交换的持续对话中与用户进行交互。存在与数字助理进行交互以请求信息或执行各种任务的许多其他方法。除提供言语响应并采取经编程的动作之外，数字助理还可提供其他视觉形式或音频形式的响应，例如作为文本、警报、音乐、视频、动画等。如图1中所示，在一些示例中，数字助理可根据客户端-服务器模型来实现。数字助理可包括在用户设备104上执行的客户端侧部分102(后文称作“da客户端102”)，以及在服务器系统108上执行的服务器侧部分106(后文称作“da服务器106”)。da客户端102可通过一个或多个网络110来与da服务器106进行通信。da客户端102可提供客户端侧功能，诸如面向用户的输入和输出处理，以及与da服务器106进行通信。da服务器106可为任意数量的da客户端102提供服务器侧功能，该任意数量的da客户端102各自位于相应的用户设备104上。在一些示例中，da服务器106可包括面向客户端的i/o接口112、一个或多个处理模块114、数据和模型116，以及至外部服务的i/o接口118。面向客户端的i/o接口112可促进针对da服务器106的面向客户端的输入和输出处理。一个或多个处理模块114可利用数据和模型116来处理语音输入，并基于自然语言输入来确定用户的意图。此外，一个或多个处理模块114基于推断出的用户意图来进行任务执行。在一些示例中，da服务器106可通过一个或多个网络110来与外部服务120进行通信，以完成任务或采集信息。至外部服务的i/o接口118可促进此类通信。用户设备104可以是任何合适的电子设备。例如，用户设备可以是便携式多功能设备(例如下面参考图2a描述的设备200)、多功能设备(例如下面参考图4描述的设备400)、或个人电子设备(例如下面参考图6a-b描述的设备600)。便携式多功能设备可以是例如还包含诸如pda和/或音乐播放器功能的其他功能的移动电话。便携式多功能设备的特定示例可包括来自appleinc.(cupertino,california)的设备、ipod设备、和设备。便携式多功能设备的其他示例可包括但不限于膝上型电脑或平板电脑。此外，在一些示例中，用户设备104可以是非便携式多功能设备。具体地，用户设备104可以是台式计算机、游戏机、电视、或电视机顶盒。在一些示例中，用户设备104可包括触敏表面(例如，触摸屏显示器和/或触摸板)。此外，用户设备104可任选地包括一个或多个其他物理用户接口设备，诸如物理键盘、鼠标、和/或操纵杆。下文更详细地描述了电子设备诸如多功能设备的各种示例。一个或多个通信网络110的示例可包括局域网(lan)和广域网(wan)，例如互联网。一个或多个通信网络110可使用任何已知的网络协议来实现，包括各种有线或无线协议，诸如例如以太网、通用串行总线(usb)、火线、全球移动通信系统(gsm)、增强型数据gsm环境(edge)、码分多址(cdma)、时分多址(tdma)、蓝牙、wi-fi、互联网协议语音(voip)、wi-max、或任何其他合适的通信协议。服务器系统108可在计算机的一个或多个独立式数据处理设备或分布式网络上实施。在一些示例中，服务器系统108还可采用第三方服务提供方(例如，第三方云服务提供方)的各种虚拟设备和/或服务来提供服务器系统108的潜在计算资源和/或基础结构资源。在一些示例中，用户设备104可经由第二用户设备122来与da服务器106进行通信。第二用户设备122可与用户设备104相似或相同。例如，第二用户设备122可类似于下文参考图2a、图4和图6a至图6b描述的设备200、设备400或设备600。用户设备104可被配置为经由直接通信连接诸如蓝牙、nfc、btle等或者经由有线或无线网络诸如局域wi-fi网络而通信耦接至第二用户设备122。在一些示例中，第二用户设备122可被配置为充当用户设备104与da服务器106之间的代理。例如，用户设备104的da客户端102可被配置为经由第二用户设备122来向da服务器106传输信息(例如，在用户设备104处接收的用户请求)。da服务器106可处理该信息并经由第二用户设备122来将相关的数据(例如，响应于用户请求的数据内容)返回到用户设备104。在一些示例中，用户设备104可被配置为将针对数据的缩略请求发送至第二用户设备122，以减少从用户设备104传输的信息量。第二用户设备122可被配置为确定添加到缩略请求的补充信息，以生成完整的请求，从而传输到da服务器106。该系统架构可有利地通过使用具有较强通信能力和/或电池电力的第二用户设备122(例如，移动电话、膝上型计算机、平板电脑等)作为至da服务器106的代理而允许具有有限通信能力和/或有限电池电力的用户设备104(例如，手表或类似的紧凑型电子设备)访问由da服务器106所提供的服务。虽然图1中仅示出两个用户设备104和122，应当理解，系统100可包括在此代理配置中被配置为与da服务器系统106进行通信的任意数量和类型的用户设备。虽然图1中所示的数字助理可包括客户端侧部分(例如，da客户端102)和服务器侧部分(例如，da服务器106)两者，但在一些示例中，数字助理的功能可被实现为被安装在用户设备上的独立式应用程序。此外，数字助理的客户端部分与服务器部分之间的功能划分在不同的具体实施中可变化。例如，在一些示例中，da客户端可以是仅提供面向用户的输入和输出处理功能并将数字助理的所有其他功能委派给后端服务器的瘦客户端。2.电子设备现在将注意力转至用于实现数字助理的客户端侧部分的电子设备的实施方案。图2a是示出根据一些实施方案的具有触敏显示器系统212的便携式多功能设备200的框图。触敏显示器212有时为了方便被叫做“触摸屏”，并且有时可被称为或被叫做“触敏显示器系统”。设备200包括存储器202(其任选地包括一个或多个计算机可读存储介质)、存储器控制器222、一个或多个处理单元(cpu)220、外围设备接口218、rf电路208、音频电路210、扬声器211、麦克风213、输入/输出(i/o)子系统206、其他输入控制设备216和外部端口224。设备200任选地包括一个或多个光学传感器264。设备200任选地包括用于检测设备200(例如触敏表面，诸如设备200的触敏显示器系统212)上的接触的强度的一个或多个接触强度传感器265。设备200任选地包括用于在设备200上生成触觉输出的一个或多个触觉输出发生器267(例如，在触敏表面诸如设备200的触敏显示器系统212或设备400的触控板455上生成触觉输出)。这些部件任选地通过一条或多条通信总线或信号线203来进行通信。如在本说明书和权利要求书中所使用的，术语触敏表面上的接触的“强度”是指触敏表面上的接触(例如，手指接触)的力或压力(每单位面积的力)，或是指触敏表面上的接触的力或压力的替代物(代用物)。接触的强度具有值范围，该值范围包括至少四个不同的值并且更典型地包括上百个不同的值(例如至少256个)。接触的强度任选地使用各种方法和各种传感器或传感器的组合来确定(或测量)。例如，在触敏表面下方或相邻于触敏表面的一个或多个力传感器任选地用于测量触敏表面上的不同点处的力。在一些具体实施中，来自多个力传感器的力测量被合并(例如，加权平均)以确定估计的接触力。类似地，触笔的压敏顶端任选地用于确定触笔在触敏表面上的压力。另选地，在触敏表面上检测到的接触面积的大小和/或其变化、邻近接触的触敏表面的电容和/或其变化、和/或邻近接触的触敏表面的电阻和/或其变化任选地被用作触敏表面上的接触的力或压力的替代物。在一些具体实施中，接触力或压力的替代测量直接用于确定是否已超过强度阈值(例如，强度阈值以与替代物测量对应的单位来描述)。在一些具体实施中，接触力或压力的替代测量被转换成估计的力或压力，并且估计的力或压力用于确定是否已超过强度阈值(例如，强度阈值是以压力的单位进行测量的压力阈值)。使用接触的强度作为用户输入的属性，从而允许用户访问用户在尺寸更小的设备上可能本来不能访问的附加设备功能，该尺寸更小的设备具有有限的实地面积以用于(例如，在触敏显示器上)显示示能表示和/或接收用户输入(例如，经由触敏显示器、触敏表面或物理控件/机械控件，诸如旋钮或按钮)。如本说明书和权利要求书中所使用的，术语“触觉输出”是指将由用户利用用户的触感检测到的设备相对于设备的先前位置的物理位移、设备的部件(例如，触敏表面)相对于设备的另一个部件(例如，外壳)的物理位移、或部件相对于设备的质心的位移。例如，在设备或设备的部件与用户对触摸敏感的表面(例如，手指、手掌或用户手部的其他部分)接触的情况下，通过物理位移生成的触觉输出将由用户解释为触感，该触感与设备或设备的部件的物理特征的所感知的变化对应。例如，触敏表面(例如，触敏显示器或触控板)的移动任选地由用户解释为对物理致动按钮的“按下点击”或“松开点击”。在一些情况下，用户将感觉到触感，诸如“按下点击”或“松开点击”，即使在通过用户的移动而物理地被按压(例如，被移位)的与触敏表面相关联的物理致动按钮没有移动时。作为另一个实施例，即使在触敏表面的光滑度无变化时，触敏表面的移动也会任选地由用户解释为或感测为触敏表面的“粗糙度”。虽然由用户对触摸的此类解释将受到用户的个体化感官知觉的限制，但是有许多触摸的感官知觉是大多数用户共有的。因此，当触觉输出被描述为与用户的特定感官知觉(例如，“松开点击”、“按下点击”、“粗糙度”)对应时，除非另外陈述，否则所生成的触觉输出与设备或其部件的物理位移对应，该物理位移将会生成典型(或普通)用户的所描述的感官知觉。应当理解，设备200仅是便携式多功能设备的一个示例，并且设备200任选地具有比所示出的更多或更少的部件，任选地组合两个或多个部件，或者任选地具有这些部件的不同配置或布置。图2a所示的各种部件以硬件、软件或硬件与软件两者的组合来实现，包括一个或多个信号处理电路和/或专用集成电路。存储器202可包括一个或多个计算机可读存储介质。该计算机可读存储介质可以是有形的和非暂态的。存储器202可包括高速随机存取存储器并且还可包括非易失性存储器，诸如一个或多个磁盘存储设备、闪存存储器设备或其他非易失性固态存储器设备。存储器控制器222可控制设备200的其他部件访问存储器202。在一些示例中，存储器202的非暂态计算机可读存储介质可用于存储指令(例如，用于执行下文描述的过程900的各方面)以供指令执行系统、装置或设备诸如基于计算机的系统、包含处理器的系统或可从指令执行系统、装置或设备获取指令并执行指令的其他系统使用或与其结合。在其他示例中，指令(例如，用于执行下文描述的过程900的各方面)可被存储在服务器系统108的非暂态计算机可读存储介质(未示出)上，或者可在存储器202的非暂态计算机可读存储介质与服务器系统108的非暂态计算机可读存储介质之间划分。在本文档的上下文中，“非暂态计算机可读存储介质”可以是可包括或存储程序以供指令执行系统、装置和设备使用或与其结合的任何介质。外围设备接口218可被用于将设备的输入和输出外围设备耦接至cpu220和存储器202。该一个或多个处理器220运行或者执行存储在存储器202中的各种软件程序和/或指令集以执行设备200的各种功能并处理数据。在一些实施方案中，外围设备接口218、cpu220和存储器控制器222可在单个芯片诸如芯片204上实现。在一些其他实施方案中，它们可在单独的芯片上实现。rf(射频)电路208接收和发送也被叫做电磁信号的rf信号。rf电路208将电信号转换为电磁信号/将电磁信号转换为电信号，并且经由电磁信号来与通信网络以及其他通信设备进行通信。rf电路208任选地包括用于执行这些功能的熟知的电路，包括但不限于天线系统、rf收发器、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、编解码芯片组、用户身份模块(sim)卡、存储器等等。rf电路208任选地通过无线通信来与网络以及其他设备进行通信，该网络为诸如互联网(也称为万维网(www))、内联网和/或无线网络诸如蜂窝电话网络、无线局域网(lan)和/或城域网(man)。rf电路208任选地包括用于诸如通过近程通信无线电部件来检测近场通信(nfc)场的熟知的电路。无线通信任选地使用多种通信标准、协议和技术中的任一者，包括但不限于全球移动通信系统(gsm)、增强型数据gsm环境(edge)、高速下行链路分组接入(hsdpa)、高速上行链路分组接入(hsupa)、演进、纯数据(ev-do)、hspa、hspa+、双小区hspa(dc-hspda)、长期演进(lte)、近场通信(nfc)、宽带码分多址(w-cdma)、码分多址(cdma)、时分多址(tdma)、蓝牙、蓝牙低功耗(btle)、无线保真(wi-fi)(例如，ieee802.11a、ieee802.11b、ieee802.11g、ieee802.11n和/或ieee802.11ac)、互联网协议语音(voip)、wi-max、电子邮件协议(例如，互联网消息访问协议(imap)和/或邮局协议(pop))、即时消息(例如，可扩展消息处理和存在协议(xmpp)、用于即时消息和存在利用扩展的会话发起协议(simple)、即时消息和存在服务(imps)、和/或短消息服务(sms))，或者包括在本文档提交日期时尚未开发出的通信协议的任何其他合适的通信协议。音频电路210、扬声器211和麦克风213提供用户和设备200之间的音频接口。音频电路210从外围设备接口218接收音频数据，将音频数据转换为电信号，并且将电信号传输到扬声器211。扬声器211将电信号转换为人类可听见的声波。音频电路210还接收由麦克风213根据声波转换的电信号。音频电路210将电信号转换为音频数据，并且将音频数据传输到外围设备接口218以用于处理。音频数据可由外围设备接口218检索自和/或传输到存储器202和/或rf电路208。在一些实施方案中，音频电路210还包括耳麦插孔(例如，图3中的312)。耳麦插孔提供音频电路210和可移除的音频输入/输出外围设备之间的接口，该音频输入/输出外围设备为诸如仅输出的耳机或者具有输出(例如，单耳耳机或双耳耳机)和输入(例如，麦克风)两者的耳麦。i/o子系统206将设备200上的输入外围设备/输出外围设备诸如触摸屏212和其他输入控制设备216耦接至外围设备接口218。i/o子系统206任选地包括显示控制器256、光学传感器控制器258、强度传感器控制器259、触觉反馈控制器261，以及用于其他输入或控制设备的一个或多个输入控制器260。该一个或多个输入控制器260从其他输入控制设备216接收电信号/将电信号发送至所述其他输入控制设备。其他输入控制设备216任选地包括物理按钮(例如下压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击轮等等。在一些另选实施方案中，输入控制器260任选地耦接至以下各项中的任一者(或不耦接至以下各项中的任一者)：键盘、红外线端口、usb端口以及指针设备诸如鼠标。一个或多个按钮(例如，图3中的308)任选地包括用于扬声器211和/或麦克风213的音量控制的增大/减小按钮。一个或多个按钮任选地包括下压按钮(例如，图3中的306)。快速按下下压按钮可解除对触摸屏212的锁定或者开始使用触摸屏上的手势来对设备进行解锁的过程，如于2005年12月23日提交的标题为“unlockingadevicebyperforminggesturesonanunlockimage”的美国专利申请11/322,549以及美国专利申请no.7,657,849中所述的，上述美国专利申请据此全文以引用方式并入本文。更长地按下下压按钮(例如，306)可使设备200开机或关机。用户能够对一个或多个按钮的功能进行自定义。触摸屏212用于实现虚拟按钮或软按钮以及一个或多个软键盘。触敏显示器212提供设备和用户之间的输入接口和输出接口。显示控制器256从触摸屏212接收电信号和/或将电信号发送至该触摸屏。触摸屏212向用户显示视觉输出。该视觉输出可包括图形、文本、图标、视频、以及它们的任意组合(统称为“图形”)。在一些实施方案中，一些或全部视觉输出可对应于用户界面对象。触摸屏212具有基于触觉和/或触觉接触来接受来自用户的输入的触敏表面、传感器或传感器组。触摸屏212和显示控制器256(与存储器202中的任何相关联的模块和/或指令集一起)检测触摸屏212上的接触(和该接触的任何移动或中断)，并且将所检测到的接触转换为与被显示在触摸屏212上的用户界面对象(例如，一个或多个软键、图标、网页或图像)的交互。在示例性实施方案中，触摸屏212与用户之间的接触点对应于用户的手指。触摸屏212可使用lcd(液晶显示器)技术、lpd(发光聚合物显示器)技术或led(发光二极管)技术，但是在其他实施方案中可使用其他显示技术。触摸屏212和显示控制器256可使用现在已知或以后将开发的多种触摸感测技术中的任何技术以及其他接近传感器阵列或用于确定与触摸屏212的一个或多个接触点的其他元件来检测接触及其任何移动或中断，该多种触摸感测技术包括但不限于电容式技术、电阻式技术、红外技术和表面声波技术。在示例性实施方案中，使用投射式互电容感测技术，诸如在来自appleinc.(cupertino,california)的和ipod中使用的技术。触摸屏212的一些实施方案中的触敏显示器可类似于以下美国专利中所述的多点触敏触控板：6,323,846(westerman等人)、6,570,557(westerman等人)和/或6,677,932(westerman)；和/或美国专利公开2002/0015024a1，这些专利文献中的每个专利文献据此全文以引用方式并入本文。然而，触摸屏212显示来自设备200的视觉输出，而触敏触控板不提供视觉输出。触摸屏212的一些实施方案中的触敏显示器可如在以下专利申请中那样进行描述：(1)于2006年5月2日提交的名称为“multipointtouchsurfacecontroller”的美国专利申请11/381,313；(2)于2004年5月6日提交的名称为“multipointtouchscreen”的美国专利申请10/840,862；(3)于2004年7月30日提交的名称为“gesturesfortouchsensitiveinputdevices”的美国专利申请10/903,964；(4)于2005年1月31日提交的名称为“gesturesfortouchsensitiveinputdevices”的美国专利申请11/048,264；(5)于2005年1月18日提交的名称为“mode-basedgraphicaluserinterfacesfortouchsensitiveinputdevices”的美国专利申请11/038,590；(6)于2005年9月16日提交的名称为“virtualinputdeviceplacementonatouchscreenuserinterface”的美国专利申请11/228,758；(7)于2005年9月16日提交的名称为“operationofacomputerwithatouchscreeninterface”的美国专利申请11/228,700；(8)于2005年9月16日提交的名称为“activatingvirtualkeysofatouch-screenvirtualkeyboard”的美国专利申请11/228,737；和(9)于2006年3月3日提交的名称为“multi-functionalhand-helddevice”的美国专利申请11/367,749。所有这些申请据此全文以引用方式并入本文。触摸屏212可具有超过100dpi的视频分辨率。在一些实施方案中，触摸屏具有约160dpi的视频分辨率。用户可使用任何合适的对象或附加物诸如触笔、手指等来与触摸屏212接触。在一些实施方案中，用户界面被设计用于主要与基于手指的接触和手势工作，由于手指在触摸屏上的接触区域较大，因此这可能不如基于触笔的输入精确。在一些实施方案中，设备将基于手指的粗略输入翻译为精确的指针/光标位置或命令，以用于执行用户所期望的动作。在一些实施方案中，除了触摸屏之外，设备200还可包括用于激活或去激活特定功能的触控板(未示出)。在一些实施方案中，触控板是设备的触敏区域，该触敏区域与触摸屏不同，其不显示视觉输出。触控板可以是与触摸屏212分开的触敏表面，或者是由触摸屏形成的触敏表面的延伸部分。设备200还包括用于为各种部件供电的电力系统262。电力系统262可包括电力管理系统、一个或多个电源(例如，电池、交流电(ac))、再充电系统、电力故障检测电路、功率变换器或逆变器、电源状态指示器(例如，发光二极管(led))以及与便携式设备中的电力的生成、管理和分配相关联的任何其他部件。设备200还可包括一个或多个光学传感器264。图2a示出了耦接至i/o子系统206中的光学传感器控制器258的光学传感器。光学传感器264可包括电荷耦合器件(ccd)或互补金属氧化物半导体(cmos)光电晶体管。光学传感器264从环境接收透射通过一个或多个透镜的光，并且将光转换为表示图像的数据。结合成像模块243(也被叫做相机模块)，光学传感器264可捕获静态图像或视频。在一些实施方案中，光学传感器位于与设备前部上的触摸屏显示器212相背对的设备200的后部上，使得触摸屏显示器可被用作用于静态图像和/或视频图像采集的取景器。在一些实施方案中，光学传感器位于设备前部上，使得在用户在触摸屏显示器上查看其他视频会议参与者时可获得该用户的图像以用于该视频会议。在一些实施方案中，光学传感器264的位置可由用户改变(例如，通过旋转设备外壳中的透镜和传感器)，使得单个光学传感器264可与触摸屏显示器一起使用，以用于视频会议和静态图像和/或视频图像采集两者。设备200任选地还包括一个或多个接触强度传感器265。图2a示出了耦接至i/o子系统206中的强度传感器控制器259的接触强度传感器。接触强度传感器265任选地包括一个或多个压阻应变仪、电容式力传感器、电力传感器、压电力传感器、光学力传感器、电容式触敏表面、或其他强度传感器(例如，用于测量触敏表面上的接触的力(或压力)的传感器)。接触强度传感器265从环境接收接触强度信息(例如，压力信息或压力信息的代用物)。在一些实施方案中，至少一个接触强度传感器与触敏表面(例如，触敏显示器系统212)并置排列或邻近。在一些实施方案中，至少一个接触强度传感器位于设备200的与位于设备200的前部上的触摸屏显示器212相背对的后部上。设备200还可包括一个或多个接近传感器266。图2a示出了耦接至外围设备接口218的接近传感器266。另选地，接近传感器266可耦接到i/o子系统206中的输入控制器260。接近传感器266可如以下美国专利申请中所述的那样执行：11/241,839，标题为“proximitydetectorinhandhelddevice”；11/240,788，标题为“proximitydetectorinhandhelddevice”；11/620,702，标题为“usingambientlightsensortoaugmentproximitysensoroutput”；11/586,862，标题为“automatedresponsetoandsensingofuseractivityinportabledevices”；以及11/638,251，标题为“methodsandsystemsforautomaticconfigurationofperipherals”，这些美国专利申请据此全文以引用方式并入本文。在一些实施方案中，当多功能设备被放置在用户的耳朵附近时(例如，当用户正在打电话时)，接近传感器关闭并且禁用触摸屏212。设备200任选地还包括一个或多个触觉输出发生器267。图2a示出了耦接至i/o子系统206中的触觉反馈控制器261的触觉输出发生器。触觉输出发生器267任选地包括一个或多个电声设备，诸如扬声器或其他音频部件；和/或将能量转换为线性运动的机电设备，诸如马达、螺线管、电活性聚合器、压电致动器、静电致动器或其他触觉输出生成部件(例如，将电信号转换为设备上的触觉输出的部件)。接触强度传感器265从触觉反馈模块233接收触觉反馈生成指令，并且在设备200上生成能够由设备200的用户感觉到的触觉输出。在一些实施方案中，至少一个触觉输出发生器与触敏表面(例如，触敏显示系统212)并置排列或邻近，并且任选地，通过竖直地(例如，向设备200的表面内/外)或横向地(例如，在与设备200的表面相同的平面中向后和向前)移动触敏表面来生成触觉输出。在一些实施方案中，至少一个触觉输出发生器传感器位于设备200的后部上，与位于设备200的前部上的触摸屏显示器212相背对。设备200还可包括一个或多个加速度计268。图2a示出了耦接至外围设备接口218的加速度计268。另选地，加速度计268可耦接到i/o子系统206中的输入控制器260。加速度计268可如标题为“acceleration-basedtheftdetectionsystemforportableelectronicdevices”的美国专利公开20050190059和标题为“methodsandapparatusesforoperatingaportabledevicebasedonanaccelerometer”的美国专利公开20060017692中所述的那样执行，这两个美国专利公开均全文以引用方式并入本文。在一些实施方案中，基于对从该一个或多个加速度计所接收的数据的分析来在触摸屏显示器上以纵向视图或横向视图显示信息。设备200任选地除了加速度计268之外还包括磁力仪(未示出)和gps(或glonass或其他全球导航系统)接收器(未示出)，以用于获得关于设备200的位置和取向(例如，纵向或横向)的信息。在一些实施方案中，存储于存储器202中的软件部件包括操作系统226、通信模块(或指令集)228、接触/运动模块(或指令集)230、图形模块(或指令集)232、文本输入模块(或指令集)234、全球定位系统(gps)模块(或指令集)235、数字助理客户端模块229以及应用程序(或指令集)236。此外，存储器202可存储数据和模型，诸如用户数据和模型231。此外，在一些实施方案中，存储器202(图2a)或470(图4)存储设备/全局内部状态257，如图2a和图4中所示的。设备/全局内部状态257包括以下各项中的一者或多者：活动应用程序状态，该活动应用程序状态用于指示哪些应用程序(如果有的话)当前是活动的；显示状态，该显示状态用于指示什么应用程序、视图或其他信息占据触摸屏显示器212的各个区域；传感器状态，该传感器状态包括从设备的各个传感器和输入控制设备216获得的信息；以及关于设备位置和/或姿态的位置信息。操作系统226(例如darwin、rtxc、linux、unix、osx、ios、windows或嵌入式操作系统诸如vxworks)包括用于控制和管理一般系统任务(例如，存储器管理、存储设备控制、功率管理等)的各种软件部件和/或驱动器，并且促进各种硬件部件和软件部件之间的通信。通信模块228促进通过一个或多个外部端口224来与其他设备进行通信，并且还包括用于处理由rf电路208和/或外部端口224所接收的数据的各种软件部件。外部端口224(例如，通用串行总线(usb)、火线等)适于直接耦接至其他设备或者间接地通过网络(例如，互联网、无线lan等)进行耦接。在一些实施方案中，外部端口是与(appleinc.的商标)设备上所使用的30针连接器相同的或类似的和/或与其兼容的多针(例如，30针)连接器。接触/运动模块230任选地检测与触摸屏212(结合显示控制器256)和其他触敏设备(例如，触控板或物理点击轮)的接触。接触/运动模块230包括各种软件部件以用于执行与接触检测相关的各种操作，诸如确定是否已发生接触(例如，检测手指按下事件)、确定接触强度(例如，接触的力或压力，或者接触的力或压力的替代物)、确定是否存在接触的移动并跟踪在触敏表面上的移动(例如，检测一个或多个手指拖动事件)，以及确定接触是否已停止(例如，检测手指抬起事件或接触断开)。接触/运动模块230从触敏表面接收接触数据。确定接触点的移动任选地包括确定接触点的速率(量值)、速度(量值和方向)和/或加速度(量值和/或方向的改变)，接触点的移动由一系列接触数据表示。这些操作任选地被应用于单点接触(例如，单指接触)或者多点同时接触(例如，“多点触摸”/多指接触)。在一些实施方案中，接触/运动模块230和显示控制器256检测触控板上的接触。在一些实施方案中，接触/运动模块230使用一组一个或多个强度阈值来确定操作是否已由用户执行(例如，确定用户是否已“点击”图标)。在一些实施方案中，根据软件参数来确定强度阈值的至少一个子集(例如，强度阈值不由特定物理致动器的激活阈值来确定，并且可在不改变设备200的物理硬件的情况下调整)。例如，在不改变触控板或触摸屏显示器硬件的情况下，触控板或触摸屏显示器的鼠标“点击”阈值可被设定为预定义的阈值的大范围中的任一个阈值。另外，在一些具体实施中，向设备的用户提供用于调节一组强度阈值中的一个或多个强度阈值(例如，通过调节各个强度阈值和/或通过利用对“强度”参数的系统级点击来一次调节多个强度阈值)的软件设置。接触/运动模块230任选地检测由用户进行的手势输入。触敏表面上的不同手势具有不同的接触图案(例如，所检测到的接触的不同运动、定时和/或强度)。因此，任选地通过检测特定的接触模式来检测手势。例如，检测手指轻击手势包括检测手指按下事件，然后在与手指按下事件相同的位置(或基本上相同的位置)处(例如，在图标的位置处)检测手指抬起(抬离)事件。作为另一个示例，在触敏表面上检测手指轻扫手势包括检测手指按下事件，然后检测一个或多个手指拖动事件，并且随后检测手指抬起(抬离)事件。图形模块232包括用于在触摸屏212或其他显示器上呈现和显示图形的各种已知的软件部件，包括用于改变所显示图形的视觉冲击(例如，亮度、透明度、饱和度、对比度或其他视觉特性)的部件。如本文所用，术语“图形”包括可被显示给用户的任何对象，非限制性地包括文本、网页、图标(诸如，包括软键的用户界面对象)、数字图像、视频、动画等。在一些实施方案中，图形模块232存储表示待使用图形的数据。每个图形任选地被分配有对应的代码。图形模块232从应用程序等接收指定待显示图形的一个或多个代码，必要时还一起接收坐标数据和其他图形属性数据，并且然后生成屏幕图像数据以输出至显示控制器256。触觉反馈模块233包括用于生成由一个或多个触觉输出发生器267使用的指令的各种软件部件，以响应于用户与设备200的交互而在设备200上的一个或多个位置处产生触觉输出。可以是图形模块232的部件的文本输入模块234提供用于在多种应用程序(例如，联系人237、电子邮件240、即时消息241、浏览器247和需要文本输入的任何其他应用程序)中输入文本的软键盘。gps模块235确定设备位置并提供这种信息以供在各种应用程序中使用(例如，提供至电话238以用于基于位置的拨号；提供至相机243作为图片/视频元数据；以及提供至提供基于位置的服务的应用程序，诸如天气桌面小程序、本地黄页桌面小程序和地图/导航桌面小程序)。数字助理客户端模块229可包括各种客户端侧数字助理指令，以提供数字助理的客户端侧功能。例如，数字助理客户端模块229可能够通过便携式多功能设备200的各种用户接口(例如，麦克风213、加速度计268、触敏显示器系统212、光学传感器229、其他输入控制设备216等)来接受声音输入(例如，语音输入)、文本输入、触摸输入和/或手势输入。数字助理客户端模块229也可能够通过便携式多功能设备200的各种输出界面(例如，扬声器211、触敏显示器系统212、一个或多个触觉输出发生器267等)来提供音频形式输出(例如，语音输出)、视觉形式输出、和/或触觉形式输出。例如，可将输出提供为语音、声音、提示、文本消息、菜单、图形、视频、动画、振动和/或以上两者或更多者的组合。在操作期间，数字助理客户端模块229可使用rf电路208来与da服务器106进行通信。用户数据和模型231可包括与用户相关联的各种数据(例如，特定于用户的词汇数据、用户偏好数据、用户指定名称发音、来自用户电子通讯录的数据、待办事项、购物清单等)以提供数字助理的客户端侧功能。此外，用户数据和模型231可包括用于处理用户输入并确定用户意图的各种模型(例如，语音识别模型、统计语言模型、自然语言处理模型、知识本体、任务流模型、服务模型等)。在一些示例中，数字助理客户端模块229可利用便携式多功能设备200的各种传感器、子系统和外围设备来从便携式多功能设备200的周围环境采样附加信息，以建立与用户、当前用户交互和/或当前用户输入相关联的上下文。在一些示例中，数字助理客户端模块229可将上下文信息或其子集与用户输入一起提供至da服务器106，以帮助推断用户意图。在一些示例中，数字助理还可使用上下文信息来确定如何准备输出并将其递送给用户。上下文信息可被称为上下文数据。在一些示例中，伴随用户输入的上下文信息可包括传感器信息，例如照明、环境噪声、环境温度、周围环境的图像或视频等。在一些示例中，上下文信息还可包括设备的物理状态，例如设备取向、设备位置、设备温度、功率电平、速度、加速度、运动模式、蜂窝信号强度等。在一些示例中，可将与da服务器106的软件状态相关的信息(例如运行过程、已安装程序、过去和当前的网络活动、后台服务、错误日志、资源使用等)和与便携式多功能设备200的软件状态相关的信息作为与用户输入相关联的上下文信息提供至da服务器106。在一些示例中，数字助理客户端模块229可响应于来自da服务器106的请求而选择性地提供被存储在便携式多功能设备200上的信息(例如，用户数据231)。在一些示例中，数字助理客户端模块229还可在da服务器106请求时引出来自用户经由自然语言对话或其他用户接口的附加输入。数字助理客户端模块229可将该附加输入传送至da服务器106，以帮助da服务器106进行意图推断和/或满足在用户请求中表达的用户意图。下文参考图7a至图7c更详细地描述数字助理。应当认识到，数字助理客户端模块229可包括下文所述的数字助理模块726的任何数量的子模块。应用程序236可包括以下模块(或指令集)，或者其子集或超集：·联系人模块237(有时被叫做通讯录或联系人列表)；·电话模块238；·视频会议模块239；·电子邮件客户端模块240；·即时消息(im)模块241；·健身支持模块242；·用于静态图像和/或视频图像的相机模块243；·图像管理模块244；·视频播放器模块；·音乐播放器模块；·浏览器模块247；·日历模块248；·桌面小程序模块249，其可包括以下各项中的一者或多者：天气桌面小程序249-1、股市桌面小程序249-2、计算器桌面小程序249-3、闹钟桌面小程序249-4、词典桌面小程序249-5，以及由用户获得的其他桌面小程序和用户创建的桌面小程序249-6；·用于制作用户创建的桌面小程序249-6的桌面小程序创建器模块250；·搜索模块251；·视频和音乐播放器模块252，其合并视频播放器模块和音乐播放器模块；·记事本模块253；·地图模块254；和/或·在线视频模块255。可被存储在存储器202中的其他应用程序236的示例包括其他文字处理应用程序、其他图像编辑应用程序、绘图应用程序、呈现应用程序、支持java的应用程序、加密、数字权益管理、语音识别和语音复制。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，联系人模块237可用于管理通讯录或联系人列表(例如，被存储在存储器202或存储器470中的联系人模块237的应用程序内部状态292中)，包括：将一个或多个姓名添加到通讯录；从通讯录删除一个或多个姓名；使一个或多个电话号码、一个或多个电子邮件地址、一个或多个物理地址或其他信息与姓名相关联；使图像与姓名相关联；对姓名进行分类和排序；提供电话号码或电子邮件地址以发起和/或促进通过电话238、视频会议模块239、电子邮件240或im241进行的通信；等等。结合rf电路208、音频电路210、扬声器211、麦克风213、触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，电话模块238可用于输入对应于电话号码的字符序列、访问联系人模块237中的一个或多个电话号码、修改已输入的电话号码、拨打相应的电话号码、进行会话以及当会话完成时断开或挂断。如上所述，无线通信可使用多个通信标准、协议和技术中的任一者。结合rf电路208、音频电路210、扬声器211、麦克风213、触摸屏212、显示控制器256、光学传感器264、光学传感器控制器258、接触/运动模块230、图形模块232、文本输入模块234、联系人模块237和电话模块238，视频会议模块239包括用于根据用户指令来发起、进行和终止用户与一个或多个其他参与者之间的视频会议的可执行指令。结合rf电路208、触摸屏212、显示控制器256、接触模块230、图形模块232和文本输入模块234，电子邮件客户端模块240包括用于响应于用户指令来创建、发送、接收和管理电子邮件的可执行指令。结合图像管理模块244，电子邮件客户端模块240使得非常容易创建和发送具有由相机模块243拍摄的静态图像或视频图像的电子邮件。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，即时消息模块241包括用于以下操作的可执行指令：输入对应于即时消息的字符序列、修改先前输入的字符、传输相应的即时消息(例如，使用短消息服务(sms)或多媒体消息服务(mms)协议以用于基于电话的即时消息，或者使用xmpp、simple或imps以用于基于互联网的即时消息)、接收即时消息以及查看所接收的即时消息。在一些实施方案中，所传输的和/或所接收的即时消息可包括图形、照片、音频文件、视频文件和/或在mms和/或增强型消息服务(ems)中支持的其他附件。如本文所用，“即时消息”是指基于电话的消息(例如，使用sms或mms传输的消息)和基于互联网的消息(例如，使用xmpp、simple或imps传输的消息)两者。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234、gps模块235、地图模块254和音乐播放器模块，健身支持模块242包括用于以下操作的可执行指令：创建健身(例如，具有时间、距离和/或卡路里燃烧目标)；与健身传感器(移动设备)进行通信；接收健身传感器数据；校准用于监测健身的传感器；选择并播放健身音乐；以及显示、存储和传输健身数据。结合触摸屏212、显示控制器256、一个或多个光学传感器264、光学传感器控制器258、接触/运动模块230、图形模块232和图像管理模块244，相机模块243包括用于以下操作的可执行指令：捕获静态图像或视频(包括视频流)并且将它们存储到存储器202中、修改静态图像或视频的特征，或从存储器202删除静态图像或视频。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234和相机模块243，图像管理模块244包括用于排列、修改(例如，编辑)，或以其他方式操控、加标签、删除、呈现(例如，在数字幻灯片或相册中)，以及存储静态图像和/或视频图像的可执行指令。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，浏览器模块247包括用于根据用户指令来浏览互联网(包括搜索、链接至、接收和显示网页或其部分，以及链接至网页的附件和其他文件)的可执行指令。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234、电子邮件客户端模块240和浏览器模块247，日历模块248包括用于根据用户指令来创建、显示、修改和存储日历以及与日历相关联的数据(例如，日历条目、待办事项等)的可执行指令。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234和浏览器模块247，桌面小程序模块249是可由用户下载并使用的微型应用程序(例如，天气桌面小程序249-1、股市桌面小程序249-2、计算器桌面小程序249-3、闹钟桌面小程序249-4和词典桌面小程序249-5)、或由用户创建的微型应用程序(例如，用户创建的桌面小程序249-6)。在一些实施方案中，桌面小程序包括html(超文本标记语言)文件、css(层叠样式表)文件和javascript文件。在一些实施方案中，桌面小程序包括xml(可扩展标记语言)文件和、javascript文件(例如，yahoo！桌面小程序)。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234和浏览器模块247，桌面小程序创建器模块250可被用户用于创建桌面小程序(例如，将网页的用户指定部分转变为桌面小程序)。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，搜索模块251包括用于根据用户指令来搜索存储器202中的匹配一个或多个搜索条件(例如，一个或多个用户指定的搜索词)的文本、音乐、声音、图像、视频和/或其他文件的可执行指令。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232、音频电路系统210、扬声器211、rf电路系统208和浏览器模块247，视频和音乐播放器模块252包括允许用户下载和回放以一种或多种文件格式(诸如mp3或aac文件)存储的所记录的音乐和其他声音文件的可执行指令，以及用于显示、呈现或以其他方式回放视频(例如，在触摸屏212上或在经由外部端口224连接的外部显示器上)的可执行指令。在一些实施方案中，设备200任选地包括mp3播放器诸如ipod(appleinc.的商标)的功能。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232和文本输入模块234，记事本模块253包括用于根据用户指令来创建和管理记事本、待办事项等的可执行指令。结合rf电路208、触摸屏212、显示控制器256、接触/运动模块230、图形模块232、文本输入模块234、gps模块235和浏览器模块247，地图模块254可用于根据用户指令来接收、显示、修改和存储地图以及与地图相关联的数据(例如，驾驶方向、与特定位置处或其附近的商店及其他兴趣点相关的数据，以及其他基于位置的数据)。结合触摸屏212、显示控制器256、接触/运动模块230、图形模块232、音频电路210、扬声器211、rf电路208、文本输入模块234、电子邮件客户端模块240和浏览器模块247，在线视频模块255包括允许用户访问、浏览、接收(例如，通过流式传输和/或下载)、回放(例如，在触摸屏上或经由外部端口224在所连接的外部显示器上)、发送具有至特定在线视频的链接的电子邮件，以及以其他方式管理一种或多种文件格式(诸如，h.264)的在线视频的指令。在一些实施方案中，使用即时消息模块241而不是电子邮件客户端模块240来发送至特定在线视频的链接。在线视频应用程序的其他描述可在于2007年6月20日提交的标题为“portablemultifunctiondevice,method,andgraphicaluserinterfaceforplayingonlinevideos”的美国临时专利申请60/936,562和于2007年12月31日提交的标题为“portablemultifunctiondevice,method,andgraphicaluserinterfaceforplayingonlinevideos”的美国专利申请11/968,067中找到，这两个专利申请的内容据此全文以引用方式并入本文。上述每个模块和应用程序对应于用于执行上述一种或多种功能以及在本专利申请中所述的方法(例如，本文所述的计算机实现的方法和其他信息处理方法)的可执行指令集。这些模块(例如，指令集)不必被实现为独立的软件程序、过程或模块，并因此在各种实施方案中可组合或以其他方式重新布置这些模块的各种子集。例如，视频播放器模块可与音乐播放器模块组合成单个模块(例如，图2a中的视频和音乐播放器模块252)。在一些实施方案中，存储器202可存储上述模块和数据结构的子集。此外，存储器202可存储上文没有描述的附加模块和数据结构。在一些实施方案中，设备200是唯一地通过触摸屏和/或触控板来执行其上预定义的一组功能的操作的设备。通过使用触摸屏和/或触控板作为用于设备200的操作的主要输入控制设备，可减少设备200上物理输入控制设备(诸如下压按钮、拨号盘等)的数量。唯一地通过触摸屏和/或触控板执行的该预定义的一组功能任选地包括在用户界面之间进行导航。在一些实施方案中，触控板在被用户触摸时将设备200从显示在设备200上的任何用户界面导航至主菜单、home菜单或根菜单。在此类实施方案中，使用触控板来实现“菜单按钮”。在一些其他实施方案中，菜单按钮是物理下压按钮或者其他物理输入控制设备，而不是触控板。图2b是示出了根据一些实施方案用于事件处理的示例性部件的框图。在一些实施方案中，存储器202(图2a)或存储器470(图4)包括事件分类器270(例如，在操作系统226中)以及相应的应用程序236-1(例如，前述应用程序237至251、255、480至490中的任一个应用程序)。事件分类器270接收事件信息并且确定要将事件信息递送到的应用程序236-1和应用程序236-1的应用程序视图291。事件分类器270包括事件监视器271和事件分配器模块274。在一些实施方案中，应用程序236-1包括应用程序内部状态292，该应用程序内部状态指示当应用程序是活动的或者正在执行时显示在触敏显示器212上的一个或多个当前应用程序视图。在一些实施方案中，设备/全局内部状态257被事件分类器270用于确定哪个(哪些)应用程序当前是活动的，并且应用程序内部状态292被事件分类器270用于确定要将事件信息递送到的应用程序视图291。在一些实施方案中，应用程序内部状态292包括附加信息，诸如以下各项中的一者或多者：当应用程序236-1恢复执行时将被使用的恢复信息、指示正被应用程序236-1显示或者准备好用于被该应用程序显示的信息的用户界面状态信息、用于使得用户能够返回到应用程序236-1的前一状态或视图的状态队列，以及用户采取的先前动作的重复/撤销队列。事件监视器271从外围设备接口218接收事件信息。事件信息包括关于子事件(例如，触敏显示器212上作为多点触摸手势的一部分的用户触摸)的信息。外围设备接口218传输其从i/o子系统206或传感器诸如接近传感器266、加速度计268和/或麦克风213(通过音频电路210)接收的信息。外围设备接口218从i/o子系统206接收的信息包括来自触敏显示器212或触敏表面的信息。在一些实施方案中，事件监视器271以预先确定的间隔发送请求至外围设备接口218。作为响应，外围设备接口218传输事件信息。在其他实施方案中，外围设备接口218仅当存在显著事件(例如，接收到高于预先确定的噪声阈值和/或超过预先确定的持续时间的输入)时才传输事件信息。在一些实施方案中，事件分类器270还包括命中视图确定模块272和/或活动事件识别器确定模块273。当触敏显示器212显示多于一个视图时，命中视图确定模块272提供用于确定子事件已在一个或多个视图内的什么地方发生的软件过程。视图由用户可在显示器上看到的控件和其他元件构成。与应用程序相关联的用户界面的另一方面是一组视图，在本文中有时也称为应用程序视图或用户界面窗口，在其中显示信息并且发生基于触摸的手势。在其中检测到触摸的(相应应用程序的)应用程序视图可对应于应用程序的程序化或视图分级结构内的程序化水平。例如，在其中检测到触摸的最低层级视图可被叫做命中视图，并且被识别为正确输入的那组事件可至少部分地基于开始基于触摸的手势的初始触摸的命中视图来确定。点击视图确定模块272接收与基于接触的手势的子事件相关的信息。当应用具有在分级结构中组织的多个视图时，命中视图确定模块272将命中视图识别为应对子事件进行处理的分级结构中的最低视图。在大多数情况下，命中视图是发起子事件(例如，形成事件或潜在事件的子事件序列中的第一子事件)在其中发生的最低水平视图。一旦命中视图被命中视图确定模块272识别，命中视图就通常接收与其被识别为命中视图所针对的同一触摸或输入源相关的所有子事件。活动事件识别器确定模块273确定视图分级结构内的哪个或哪些视图应接收特定子事件序列。在一些实施方案中，活动事件识别器确定模块273确定仅命中视图应接收特定子事件序列。在其他实施方案中，活动事件识别器确定模块273确定包括子事件的物理位置的所有视图是活跃参与的视图，并且因此确定所有活跃参与的视图都应接收特定子事件序列。在其他实施方案中，即使触摸子事件完全被局限到与一个特定视图相关联的区域，但在分级结构中较高的视图将仍然保持为活跃参与的视图。事件分配器模块274将事件信息分配至事件识别器(例如，事件识别器280)。在包括活动事件识别器确定模块273的实施方案中，事件分配器模块274将事件信息递送到由活动事件识别器确定模块273确定的事件识别器。在一些实施方案中，事件分配器模块274在事件队列中存储事件信息，该事件信息由相应事件接收器282进行检索。在一些实施方案中，操作系统226包括事件分类器270。另选地，应用程序236-1包括事件分类器270。在另一实施方案中，事件分类器270是独立的模块，或者是存储在存储器202中的另一模块(诸如接触/运动模块230)的一部分。在一些实施方案中，应用程序236-1包括多个事件处理程序290和一个或多个应用程序视图291，其中每个应用程序视图包括用于处理发生在应用程序的用户界面的相应视图内的触摸事件的指令。应用程序236-1的每个应用程序视图291包括一个或多个事件识别器280。通常，相应应用程序视图291包括多个事件识别器280。在其他实施方案中，事件识别器280中的一个或多个事件识别器是独立模块的一部分，该独立模块诸如用户界面工具包(未示出)或应用程序236-1从中继承方法和其他属性的更高层级的对象。在一些实施方案中，相应事件处理程序290包括以下各项中的一者或多者：数据更新器276、对象更新器277、gui更新器278、和/或从事件分类器270接收的事件数据279。事件处理程序290可利用或调用数据更新器276、对象更新器277或gui更新器278，以更新应用程序内部状态292。另选地，应用程序视图291中的一个或多个应用程序视图包括一个或多个相应事件处理程序290。另外，在一些实施方案中，数据更新器276、对象更新器277和gui更新器278中的一者或多者被包括在相应应用程序视图291中。相应事件识别器280从事件分类器270接收事件信息(例如，事件数据279)，并且从事件信息识别事件。事件识别器280包括事件接收器282和事件比较器284。在一些实施方案中，事件识别器280还至少包括元数据283和事件递送指令288(其可包括子事件递送指令)的子集。事件接收器282从事件分类器270接收事件信息。事件信息包括关于子事件例如触摸或触摸移动的信息。根据子事件，事件信息还包括附加信息，诸如子事件的位置。当子事件涉及触摸的运动时，事件信息还可包括子事件的速率和方向。在一些实施方案中，事件包括设备从一个取向旋转到另一取向(例如，从纵向取向到横向取向，或反之亦然)的旋转，并且事件信息包括关于设备的当前取向(也被称为设备姿态)的对应信息。事件比较器284将事件信息与预定义的事件或子事件定义进行比较，并且基于该比较，确定事件或子事件，或者确定或更新事件或子事件的状态。在一些实施方案中，事件比较器284包括事件定义286。事件定义286包含事件的定义(例如，预定义的子事件序列)，例如事件1(287-1)、事件2(287-2)等。在一些实施方案中，事件(287)中的子事件包括例如触摸开始、触摸结束、触摸移动、触摸取消和多点触摸。在一个示例中，事件1(287-1)的定义是在被显示对象上的双击。例如，双击包括被显示对象上的预先确定时长的第一次触摸(触摸开始)、预先确定时长的第一次抬起(触摸结束)、被显示对象上的预先确定时长的第二次触摸(触摸开始)以及预先确定时长的第二次抬起(触摸结束)。在另一示例中，事件2(287-2)的定义是在被显示对象上的拖动。例如，拖动包括被显示对象上的预先确定时长的触摸(或接触)、触摸在触敏显示器212上的移动、以及触摸的抬离(触摸结束)。在一些实施方案中，事件还包括用于一个或多个相关联的事件处理程序290的信息。在一些实施方案中，事件定义287包括对用于相应用户界面对象的事件的定义。在一些实施方案中，事件比较器284执行命中测试以确定哪个用户界面对象与子事件相关联。例如，在其中在触摸显示器212上显示三个用户界面对象的应用程序视图中，当在触敏显示器212上检测到触摸时，事件比较器284执行命中测试以确定这三个用户界面对象中的哪一个用户界面对象与触摸(子事件)相关联。如果每个被显示对象与相应事件处理程序290相关联，则事件比较器使用该命中测试的结果来确定哪个事件处理程序290应当被激活。例如，事件比较器284选择与子事件和触发该命中测试的对象相关联的事件处理程序。在一些实施方案中，相应事件(287)的定义还包括延迟动作，该延迟动作延迟事件信息的递送，直到已确定子事件序列是否对应于或不对应于事件识别器的事件类型。当相应事件识别器280确定子事件系列不与事件定义286中的任何事件匹配时，该相应事件识别器280进入事件不可能、事件失败或事件结束状态，在此之后忽视基于触摸的手势的后续子事件。在这种情况下，对于命中视图保持活动的其它事件识别器(如果有的话)继续跟踪和处理正在进行的基于触摸的手势的子事件。在一些实施方案中，相应事件识别器280包括元数据283，该元数据具有指示事件递送系统应该如何执行对活跃参与的事件识别器的子事件递送的可配置属性、标志和/或列表。在一些实施方案中，元数据283包括用于指示事件识别器可如何彼此进行交互或者如何被启用以彼此进行交互的可配置属性、标志和/或列表。在一些实施方案中，元数据283包括指示子事件是否被递送到视图或程序化分级结构中的不同层级的可配置属性、标志和/或列表。在一些实施方案中，当识别事件的一个或多个特定子事件时，相应事件识别器280激活与事件相关联的事件处理程序290。在一些实施方案中，相应事件识别器280将与事件相关联的事件信息递送到事件处理程序290。激活事件处理程序290不同于将子事件发送(和延期发送)到相应命中视图。在一些实施方案中，事件识别器280抛出与所识别事件相关联的标志，并且与该标志相关联的事件处理程序290捕捉该标志并执行预定义过程。在一些实施方案中，事件递送指令288包括在不激活事件处理程序的情况下递送关于子事件的事件信息的子事件递送指令。相反，子事件递送指令将事件信息递送到与子事件系列相关联的事件处理程序或递送到活跃参与的视图。与子事件系列或与活跃参与的视图相关联的事件处理程序接收事件信息并执行预先确定的过程。在一些实施方案中，数据更新器276创建并更新在应用程序236-1中所使用的数据。例如，数据更新器276更新联系人模块237中所使用的电话号码，或者存储视频播放器模块中所使用的视频文件。在一些实施方案中，对象更新器277创建并更新在应用程序236-1中所使用的对象。例如，对象更新器277创建新用户界面对象或者更新用户界面对象的位置。gui更新器278更新gui。例如，gui更新器278准备显示信息并将其发送至图形模块232以在触敏显示器上显示。在一些实施方案中，一个或多个事件处理程序290包括数据更新器276、对象更新器277和gui更新器278或者具有对数据更新器276、对象更新器277和gui更新器278的访问权限。在一些实施方案中，数据更新器276、对象更新器277和gui更新器278被包括在相应应用程序236-1或应用程序视图291的单个模块中。在其他实施方案中，它们被包括在两个或更多个软件模块中。应当理解，关于触敏显示器上的用户触摸的事件处理的上述论述还适用于利用输入设备来操作多功能设备200的其他形式的用户输入，并非所有用户输入都是在触摸屏上发起的。例如，任选地与单次或多次键盘按压或保持结合的鼠标移动和鼠标按钮按压；触摸板上的接触移动，诸如轻击、拖动、滚动等；触笔输入；设备的移动；口头指令；所检测到的眼睛移动；生物特征输入；和/或其任意组合任选地被用作与定义要识别的事件的子事件对应的输入。图3示出了根据一些实施方案的具有触摸屏212的便携式多功能设备200。触摸屏任选地在用户界面(ui)300内显示一个或多个图形。在本实施方案中以及在下文描述的其他实施方案中，用户能够通过例如利用一个或多个手指302(在附图中未按比例绘制)或者利用一支或多支触笔303(在附图中未按比例绘制)在图形上做出手势来选择这些图形中的一个或多个图形。在一些实施方案中，当用户中断与一个或多个图形的接触时，将发生对一个或多个图形的选择。在一些实施方案中，手势任选地包括一次或多次轻击、一次或多次轻扫(从左向右、从右向左、向上和/或向下)，和/或已与设备200发生接触的手指的滚动(从右向左、从左向右、向上和/或向下)。在一些具体实施中或在一些情况下，不经意地与图形接触不会选择图形。例如，当与选择对应的手势是轻击时，在应用程序图标上方扫动的轻扫手势任选地不会选择对应应用程序。设备200还可包括一个或多个物理按钮，诸如“home”或菜单按钮304。如前所述，菜单按钮304可用于导航到可在设备200上执行的一组应用程序中的任何应用程序236。另选地，在一些实施方案中，菜单按钮被实现为在触摸屏212上显示的gui中的软键。在一个实施方案中，设备200包括触摸屏212、菜单按钮304、用于使设备通电/断电和用于锁定设备的下压按钮306、一个或多个音量调节按钮308、用户身份模块(sim)卡槽310、耳麦插孔312、和对接/充电外部端口224。下压按钮306任选地用于：通过按下按钮并使按钮在下压状态保持预定义的时间间隔来使设备通电/断电；通过按下按钮并在经过预定义的时间间隔之前释放按钮来锁定设备；和/或解锁设备或者发起解锁过程。在另选的实施方案中，设备200还通过麦克风213接受用于激活或去激活某些功能的语音输入。设备200还任选地包括用于检测触摸屏212上的接触强度的一个或多个接触强度传感器265，和/或用于为设备200的用户生成触觉输出的一个或多个触觉输出发生器267。图4是根据一些实施方案的具有显示器和触敏表面的示例性多功能设备的框图。设备400不必是便携式的。在一些实施方案中，设备400是膝上型计算机、台式计算机、平板电脑、多媒体播放器设备、导航设备、教育设备(诸如儿童学习玩具)、游戏系统或控制设备(例如，家用或工业用控制器)。设备400通常包括一个或多个处理单元(cpu)410、一个或多个网络或其他通信接口460、存储器470、和用于使这些部件互连的一个或多个通信总线420。通信总线420任选地包括使系统部件互连并且控制系统部件之间的通信的电路系统(有时被叫做芯片组)。设备400包括具有显示器440的输入/输出(i/o)接口430，该显示器通常是触摸屏显示器。i/o接口430还任选地包括键盘和/或鼠标(或其他指向设备)450以及触控板455、用于在设备400上生成触觉输出的触觉输出发生器457(例如，类似于以上参考图2a所述的一个或多个触觉输出发生器267)、传感器459(例如，光学传感器、加速度传感器、接近传感器、触敏传感器，和/或类似于以上参考图2a所述的一个或多个接触强度传感器265的接触强度传感器)。存储器470包括高速随机存取存储器，诸如dram、sram、ddrram或其他随机存取固态存储器设备，并且任选地包括非易失性存储器，诸如一个或多个磁盘存储设备、光盘存储设备、闪存存储器设备或其他非易失性固态存储设备。存储器470任选地包括定位远离一个或多个cpu410的一个或多个存储设备。在一些实施方案中，存储器470存储与存储在便携式多功能设备200(图2a)的存储器202中的程序、模块和数据结构类似的程序、模块和数据结构或其子集。此外，存储器470任选地存储在便携式多功能设备200的存储器202中不存在的附加程序、模块和数据结构。例如，设备400的存储器470任选地存储绘图模块480、呈现模块482、文字处理模块484、网站创建模块486、盘编辑模块488，和/或电子表格模块490，而便携式多功能设备200(图2a)的存储器202任选地不存储这些模块。图4中的上述元素中的每个元素可存储在一个或多个前面提及的存储器设备中。上述模块中的每个模块对应于用于执行上述功能的指令集。上述模块或程序(例如，指令集)不必被实现为单独的软件程序、过程或模块，并且因此这些模块的各种子集可在各种实施方案中被组合或以其他方式重新布置。在一些实施方案中，存储器470可存储上述模块和数据结构的子集。此外，存储器470可存储上文没有描述的附加模块和数据结构。现在将注意力转向可在例如便携式多功能设备200上实现的用户界面的实施方案。图5a示出了根据一些实施方案的便携式多功能设备200上的应用程序菜单的示例性用户界面。类似的用户界面可在设备400上实现。在一些实施方案中，用户界面500包括以下元素或者其子集或超集：一种或多种无线通信(诸如蜂窝信号和wi-fi信号)的一个或多个信号强度指示器502；·时间504；·蓝牙指示器505；·电池状态指示器506；·具有常用应用程序图标的托盘508，图标诸如：○电话模块238的被标记为“电话”的图标516，该图标任选地包括未接来电或语音留言的数量的指示符514；○电子邮件客户端模块240的被标记为“邮件”的图标518，该图标任选地包括未读电子邮件的数量的指示符510；○浏览器模块247的被标记为“浏览器”的图标520；以及○视频和音乐播放器模块252(也称为ipod(appleinc.的商标)模块252)的被标记为“ipod”的图标522；以及·其他应用程序的图标，诸如：○im模块241的被标记为“消息”的图标524；○日历模块248的被标记为“日历”的图标526；○图像管理模块244的被标记为“照片”的图标528；○相机模块243的被标记为“相机”的图标530；○在线视频模块255的被标记为“在线视频”的图标532；○股市桌面小程序249-2的被标记为“股市”的图标534；○地图模块254的被标记为“地图”的图标536；○天气桌面小程序249-1的被标记为“天气”的图标538；○闹钟桌面小程序249-4的被标记为“时钟”的图标540；○健身支持模块242的被标记为“健身支持”的图标542；○记事本模块253的被标记为“记事本”的图标544；以及○用于设置应用程序或模块的被标记为“设置”的图标546，其提供对设备200及其各种应用程序236的设置的访问。应当指出的是，图5a中示出的图标标签仅是示例性的。例如，视频和音乐播放器模块252的图标522可任选地被标记为“音乐”或“音乐播放器”。其他标签任选地用于各种应用程序图标。在一些实施方案中，相应应用图标的标签包括与该相应应用图标对应的应用的名称。在一些实施方案中，特定应用程序图标的标签不同于与该特定应用程序图标对应的应用程序的名称。图5b示出了具有与显示器550(例如，触摸屏显示器212)分开的触敏表面551(例如，图4的平板电脑或触控板455)的设备(例如，图4的设备400)上的示例性用户界面。设备400还任选地包括用于检测触敏表面551上的接触的强度的一个或多个接触强度传感器(例如，传感器457中的一个或多个传感器)、和/或用于为设备400的用户生成触觉输出的一个或多个触觉输出发生器459。尽管将参考触摸屏显示器212(其中组合了触敏表面和显示器)上的输入给出随后的示例中的一些示例，但是在一些实施方案中，设备检测与显示器分开的触敏表面上的输入，如图5b所示。在一些实施方案中，触敏表面(例如，图5b中的551)具有对应于显示器(例如，550)上的主轴(例如，图5b中的553)的主轴(例如，图5b中的552)。根据这些实施方案，设备检测在对应于显示器上的相应位置的位置(例如，在图5b中，560对应于568并且562对应于570)处与触敏表面551的接触(例如，图5b中的560和562)。这样，当触敏表面(例如，图5b中的551)与多功能设备的显示器(图5b中的550)分开时，设备在触敏表面上检测到的用户输入(例如，接触560和562以及它们的移动)被该设备用于操控显示器上的用户界面。应当理解，类似的方法任选地用于本文所述的其他用户界面。另外，虽然主要是参考手指输入(例如，手指接触、单指轻击手势、手指轻扫手势)来给出下面的示例，但是应当理解，在一些实施方案中，这些手指输入中的一个或多个手指输入由来自另一输入设备的输入(例如，基于鼠标的输入或触笔输入)替代。例如，轻扫手势任选地由鼠标点击(例如，而不是接触)，之后是光标沿着轻扫的路径的移动(例如，而不是接触的移动)来代替。又如，轻击手势任选地由在光标位于轻击手势的位置上方时的鼠标点击(例如，而不是对接触的检测，以及之后的停止检测接触)来代替。类似地，当同时检测到多个用户输入时，应当理解的是，多个计算机鼠标任选地被同时使用，或鼠标和手指接触任选地被同时使用。图6a示出了示例性个人电子设备600。设备600包括主体602。在一些实施方案中，设备600可包括针对设备200和400(例如，图2a至图4b)所述的特征中的一些或全部特征。在一些实施方案中，设备600具有在下文中被称为触摸屏604的触敏显示屏604。另选地或除了触摸屏604之外，设备600具有显示器和触敏表面。与设备200和设备400的情况一样，在一些实施方案中，触摸屏604(或触敏表面)可具有用于检测正施加的接触(例如，触摸)强度的一个或多个强度传感器。触摸屏604(或触敏表面)的一个或多个强度传感器可提供表示触摸强度的输出数据。设备600的用户界面可基于触摸强度来对触摸做出响应，这意味着不同强度的触摸可调用设备600上的不同的用户界面操作。例如，可在如下相关专利申请中找到用于检测和处理触摸强度的技术：于2013年5月8日提交的标题为“device,method,andgraphicaluserinterfacefordisplayinguserinterfaceobjectscorrespondingtoanapplication”的国际专利申请序列pct/us2013/040061，以及于2013年11月11日提交的标题为“device,method,andgraphicaluserinterfacefortransitioningbetweentouchinputtodisplayoutputrelationships”的国际专利申请序列pct/us2013/069483，这两个专利申请中的每个专利申请据此全文以引用方式并入本文。在一些实施方案中，设备600具有一个或多个输入机构606和输入机构608。输入机构606和输入机构608(如果包括的话)可以是物理的。物理输入机构的示例包括下压按钮和可旋转机构。在一些实施方案中，设备600具有一个或多个附接机构。此类附接机构(如果包括的话)可允许将设备600与例如帽子、眼镜、耳环、项链、衬衣、夹克、手镯、表带、手链、裤子、皮带、鞋子、钱包、背包等附接。这些附接机构可允许用户穿戴设备600。图6b示出了示例性个人电子设备600。在一些实施方案中，设备600可包括相对于图2a、图2b和图4所述的部件中的一些或全部部件。设备600具有总线612，该总线将i/o部分614与一个或多个计算机处理器616以及存储器618操作性地耦接。i/o部分614可连接到显示器604，该显示器可具有触敏部件622并且任选地具有触摸强度敏感部件624。此外，i/o部分614可连接到通信单元630，以用于使用wi-fi、蓝牙、近场通信(nfc)、蜂窝和/或其他无线通信技术来接收应用程序和操作系统数据。设备600可包括输入机构606和/或输入机构608。例如，输入机构606可以是可旋转输入设备或者可按压且可旋转输入设备。在一些示例中，输入机构608可以是按钮。在一些示例中，输入机构608可以是麦克风。个人电子设备600可包括各种传感器，诸如gps传感器632、加速度计634、定向传感器640(例如，罗盘)、陀螺仪636、运动传感器638和/或其组合，所有这些设备均可操作地连接到i/o部分614。个人电子设备600的存储器618可是用于存储计算机可执行指令的非暂态计算机可读存储介质，该计算机可执行指令当由一个或多个计算机处理器616执行时，例如可使得计算机处理器执行下文描述的包括过程900(图8a至图8d)的技术。计算机可执行指令也可存储在任何非暂态计算机可读存储介质内和/或在其内传输，以供指令执行系统、装置或设备诸如基于计算机的系统、包括处理器的系统或可从指令执行系统、装置或设备获取指令并执行指令的其他系统使用或与其结合。对于本文的目的而言，“非暂态计算机可读存储介质”可是可有形地包含或存储计算机可执行指令以供指令执行系统、装置或设备使用或与其结合的任何介质。非暂态计算机可读存储介质可包括但不限于磁存储装置、光学存储装置、和/或半导体存储装置。此类存储装置的示例包括磁盘、基于cd、dvd或blu-ray技术的光盘，以及持久性固态存储器(诸如闪存、固态驱动器)等。个人电子设备600不限于图6b的部件和配置，而是可包括多种配置中的其他部件或附加部件。如本文所用，术语“示能表示”是指可在设备200,z400和/或600(图2、图4和图6)的显示屏上显示的用户交互式图形用户界面对象。例如，图像(例如，图标)、按钮和文本(例如，超链接)可各自构成示能表示。如本文所用，术语“焦点选择器”是指用于指示用户正与之进行交互的用户界面的当前部分的输入元件。在包括光标或其他位置标记的一些具体实施中，光标充当“焦点选择器”，使得在光标在特定用户界面元素(例如，按钮、窗口、滑块或其他用户界面元素)上方时在触敏表面(例如，图4中的触控板455或图5b中的触敏表面551)上检测到输入(例如，按压输入)的情况下，该特定用户界面元素根据所检测到的输入而被调节。在包括能够实现与触摸屏显示器上的用户界面元素的直接交互的触摸屏显示器(例如，图2a中的触敏显示系统212或图5a中的触摸屏212)的一些具体实施中，触摸屏上的所检测到的接触充当“焦点选择器”，使得当在触摸屏显示器上在特定用户界面元素(例如，按钮、窗口、滑块或其他用户界面元素)的位置处检测到输入(例如，由接触进行的按压输入)时，该特定用户界面元素根据所检测到的输入而被调节。在一些具体实施中，焦点从用户界面的一个区域移动到用户界面的另一区域，而无需光标的对应移动或触摸屏显示器上的接触的移动(例如，通过使用制表键或箭头键将焦点从一个按钮移动到另一按钮)；在这些具体实施中，焦点选择器根据用户界面的不同区域之间的焦点移动而移动。不考虑焦点选择器所采取的具体形式，焦点选择器通常是由用户控制的，以便传送与用户界面的用户预期的交互(例如，通过向设备指示用户界面的用户期望与其进行交互的元素)的用户界面元素(或触摸屏显示器上的接触)。例如，在触敏表面(例如，触摸板或触摸屏)上检测到按压输入时，焦点选择器(例如，光标、接触或选择框)在相应按钮上方的位置将指示用户期望激活相应按钮(而不是设备的显示器上示出的其他用户界面元素)。如说明书和权利要求书中所使用的，接触的“特征强度”这一术语是指基于接触的一个或多个强度的接触的特征。在一些实施方案中，特性强度基于多个强度样本。特性强度任选地基于相对于预定义事件(例如，在检测到接触之后，在检测到接触抬起之前，在检测到接触开始移动之前或之后，在检测到接触结束之前，在检测到接触的强度增大之前或之后和/或在检测到接触的强度减小之前或之后)而言在预先确定的时间段(例如，0.05秒、0.1秒、0.2秒、0.5秒、1秒、2秒、5秒、10秒)期间采样的预定义数量的强度样本或一组强度样本。接触的特性强度任选地基于以下各项中的一者或多者：接触强度的最大值、接触强度的均值、接触强度的平均值、接触强度的前10％处的值、接触强度的半最大值、接触强度的90％最大值等。在一些实施方案中，在确定特性强度时使用接触的持续时间(例如，在特性强度是接触的强度在时间上的平均值时)。在一些实施方案中，将特性强度与一组一个或多个强度阈值进行比较，以确定用户是否已执行操作。例如，该组一个或多个强度阈值可包括第一强度阈值和第二强度阈值。在该示例中，特征强度未超过第一阈值的接触导致第一操作，特征强度超过第一强度阈值但未超过第二强度阈值的接触导致第二操作，并且特征强度超过第二阈值的接触导致第三操作。在一些实施方案中，使用特征强度与一个或多个阈值之间的比较来确定是否要执行一个或多个操作(例如，是执行相应操作还是放弃执行相应操作)，而不是用于确定执行第一操作还是第二操作。在一些实施方案中，识别手势的一部分以用于确定特征强度。例如，触敏表面可接收连续的轻扫接触，该连续的轻扫接触从起始位置过渡并到达结束位置，在该结束位置处，接触的强度增加。在该示例中，接触在结束位置处的特征强度可仅基于连续轻扫接触的一部分，而不是整个轻扫接触(例如，仅结束位置处的轻扫接触的一部分)。在一些实施方案中，可在确定接触的特征强度之前向轻扫手势的强度应用平滑化算法。例如，该平滑化算法任选地包括以下各项中的一者或多者：不加权滑动平均平滑化算法、三角平滑化算法、中值滤波器平滑化算法、和/或指数平滑化算法。在一些情况下，这些平滑化算法消除了轻扫接触的强度中的窄的尖峰或凹陷，以用于确定特征强度。可相对于一个或多个强度阈值诸如接触检测强度阈值、轻按压强度阈值、深按压强度阈值、和/或一个或多个其他强度阈值来表征触敏表面上的接触的强度。在一些实施方案中，轻按压强度阈值对应于这样的强度：在该强度下设备将执行通常与点击物理鼠标或触控板的按钮相关联的操作。在一些实施方案中，深按压强度阈值对应于这样的强度：在该强度下设备将执行与通常与点击物理鼠标或触控板的按钮相关联的操作不同的操作。在一些实施方案中，当检测到特征强度低于轻按压强度阈值(例如，并且高于标称接触检测强度阈值，比标称接触检测强度阈值低的接触不再被检测到)的接触时，设备将根据接触在触敏表面上的移动来移动焦点选择器，而不执行与轻按压强度阈值或深按压强度阈值相关联的操作。一般来讲，除非另有陈述，否则这些强度阈值在不同组的用户界面附图之间是一致的。接触的特征强度从低于轻按压强度阈值的强度增大到介于轻按压强度阈值与深按压强度阈值之间的强度有时称为“轻按压”输入。接触的特征强度从低于深按压强度阈值的强度增大到高于深按压强度阈值的强度有时称为“深按压”输入。接触的特征强度从低于接触检测强度阈值的强度增大到介于接触检测强度阈值与轻按压强度阈值之间的强度有时称为检测到触摸表面上的接触。接触的特征强度从高于接触检测强度阈值的强度减小到低于接触检测强度阈值的强度有时称为检测到接触从触摸表面抬离。在一些实施方案中，接触检测强度阈值为零。在一些实施方案中，接触检测强度阈值大于零。在本文中所述的一些实施方案中，响应于检测到包括相应按压输入的手势或响应于检测到利用相应接触(或多个接触)执行的相应按压输入来执行一个或多个操作，其中至少部分地基于检测到该接触(或多个接触)的强度增大到高于按压输入强度阈值而检测到相应按压输入。在一些实施方案中，响应于检测到相应接触的强度增大到高于按压输入强度阈值(例如，相应按压输入的“向下冲程”)来执行相应操作。在一些实施方案中，按压输入包括相应接触的强度增大到高于按压输入强度阈值以及该接触的强度随后减小到低于按压输入强度阈值，并且响应于检测到相应接触的强度随后减小到低于按压输入阈值(例如，相应按压输入的“向上冲程”)来执行相应操作。在一些实施方案中，设备采用强度滞后以避免有时被命名为“抖动”的意外输入，其中设备限定或选择与按压输入强度阈值具有预定义关系的滞后强度阈值(例如，滞后强度阈值比按压输入强度阈值低x个强度单位，或者滞后强度阈值是按压输入强度阈值的75％、90％或某个合理比例)。因此，在一些实施方案中，按压输入包括相应接触的强度增大到高于按压输入强度阈值以及该接触的强度随后减小到低于对应于按压输入强度阈值的滞后强度阈值，并且响应于检测到相应接触的强度随后减小到低于滞后强度阈值(例如，相应按压输入的“向上冲程”)来执行相应操作。类似地，在一些实施方案中，仅在设备检测到接触的强度从等于或低于滞后强度阈值的强度增大到等于或高于按压输入强度阈值的强度并且任选地接触的强度随后减小到等于或低于滞后强度的强度时才检测到按压输入，并且响应于检测到按压输入(例如，根据环境，接触的强度增大或接触的强度减小)来执行相应操作。为了便于解释，任选地，响应于检测到以下各种情况中的任一种情况而触发响应于与按压输入强度阈值相关联的按压输入或响应于包括按压输入的手势而执行的操作的描述：接触的强度增大到高于按压输入强度阈值、接触的强度从低于滞后强度阈值的强度增大到高于按压输入强度阈值的强度、接触的强度减小到低于按压输入强度阈值，和/或接触的强度减小到低于对应于按压输入强度阈值的滞后强度阈值。另外，在将操作描述为响应于检测到接触的强度减小到低于按压输入强度阈值而执行的示例中，任选地响应于检测到接触的强度减小到低于对应于并且小于按压输入强度阈值的滞后强度阈值来执行操作。3.数字助理系统图7a示出根据各种示例的数字助理系统700的框图。在一些示例中，数字助理系统700可在独立式计算机系统上实现。在一些示例中，数字助理系统700可跨多个计算机分布。在一些示例中，数字助理的模块和功能中的一些模块和功能可被划分成服务器部分和客户端部分，其中客户端部分位于一个或多个用户设备(例如，设备104,122,200,400或600)上并通过一个或多个网络来与服务器部分(例如，服务器系统108)进行通信，例如，如图1所示。在一些示例中，数字助理系统700可以是图1中所示的服务器系统108(和/或da服务器106)的具体实施。应当指出的是，数字助理系统700仅为数字助理系统的一个示例，并且该数字助理系统700可具有比所示更多或更少的部件、可组合两个或更多个部件，或者可具有部件的不同配置或布置。图7a中所示的各种部件可在硬件、用于由一个或多个处理器执行的软件指令、固件(包括一个或多个信号处理集成电路和/或专用集成电路)、或它们的组合中实现。数字助理系统700可包括存储器702、一个或多个处理器704、输入/输出(i/o)接口706、以及网络通信接口708。这些部件可通过一个或多个通信总线或信号线710彼此进行通信。在一些示例中，存储器702可包括非暂态计算机可读介质，诸如高速随机存取存储器和/或非易失性计算机可读存储介质(例如，一个或多个磁盘存储设备、闪存存储器设备、或其他非易失性固态存储器设备)。在一些示例中，i/o接口706可将数字助理系统700的输入/输出设备716诸如显示器、键盘、触摸屏和麦克风耦接至用户界面模块722。与用户界面模块722结合的i/o接口706可接收用户输入(例如，声音输入、键盘输入、触摸输入等)并相应地对这些输入进行处理。在一些示例中，例如，当数字助理在独立式用户设备上实现时，数字助理系统700可包括分别相对于图2a、图4、图6a-b中的设备200,400或600所描述的部件和i/o通信接口中的任一者。在一些示例中，数字助理系统700可代表数字助理具体实施的服务器部分，并且可通过位于用户设备(例如，设备104,200,400或设备600)上的客户端侧部分来与用户进行交互。在一些示例中，网络通信接口708可包括一个或多个有线通信端口712、和/或无线传输和接收电路714。一个或多个有线通信端口可经由一个或多个有线接口例如以太网、通用串行总线(usb)、火线等来接收和发送通信信号。无线电路714可从通信网络以及其他通信设备接收rf信号和/或光学信号，并且将rf信号和/或光学信号发送至通信网络以及其他通信设备。无线通信可使用多种通信标准、协议和技术中的任一者，诸如gsm、edge、cdma、tdma、蓝牙、wi-fi、voip、wi-max、或任何其他合适的通信协议。网络通信接口708可使得数字助理系统700通过网络诸如互联网、内联网和/或无线网络(诸如蜂窝电话网络、无线局域网(lan)和/或城域网(man))与其他设备之间的通信成为可能。在一些示例中，存储器702或存储器702的计算机可读存储介质可存储程序、模块、指令和数据结构，包括以下内容中的全部或其子集：操作系统718、通信模块720、用户界面模块722、一个或多个应用程序724、和数字助理模块726。具体地，存储器702或存储器702的计算机可读存储介质可存储用于执行下文描述的过程900的指令。一个或多个处理器704可执行这些程序、模块和指令，并从数据结构读取数据或将数据写到数据结构。操作系统718(例如，darwin、rtxc、linux、unix、osx、windows，或嵌入式操作系统诸如vxworks)可包括用于控制和管理一般系统任务(例如，存储器管理、存储设备控制、电源管理等)的各种软件部件和/或驱动器，并且促进各种硬件、固件和软件部件之间的通信。通信模块720可促进数字助理系统700与其他设备之间的通过网络通信接口708进行的通信。例如，通信模块720可与电子设备(诸如，分别在图2a、图4、图6a-b中示出的设备200,400和600)的rf电路208进行通信。通信模块720还可包括用于处理由无线电路714和/或有线通信端口712所接收的数据的各种部件。用户界面模块722可经由i/o接口706来接收来自用户(例如，来自键盘、触摸屏、指向设备、控制器和/或麦克风)的命令和/或输入，并在显示器上生成用户界面对象。用户界面模块722还可准备输出(例如，语音、声音、动画、文本、图标、振动、触觉反馈、光照等)并将其经由i/o接口706(例如，通过显示器、音频通道、扬声器、触控板等)递送给用户。应用程序724可包括被配置为由一个或多个处理器704执行的程序和/或模块。例如，如果数字助理系统在独立式用户设备上实现，则应用程序724可包括用户应用程序，诸如游戏、日历应用程序、导航应用程序、或邮件应用程序。如果数字助理系统700在服务器上实现，则应用程序724可包括例如资源管理应用程序、诊断应用程序、或调度应用程序。存储器702还可存储数字助理模块726(或数字助理的服务器部分)。在一些示例中，数字助理模块726可包括以下子模块或者其子集或超集：输入/输出处理模块728、语音转文本(stt)处理模块730、自然语言处理模块732、对话流处理模块734、任务流处理模块736、服务处理模块738和语音合成模块740。这些模块中的每个模块均可具有对以下数字助理模块726的系统或数据与模型中的一者或多者或者其子集或超集的访问权限：知识本体760、词汇索引744、用户数据748、任务流模型754、服务模型756和asr系统。在一些示例中，使用在数字助理模块726上实现的处理模块、数据和模型，数字助理可执行以下内容中的至少一些内容：将语音输入转换为文本；识别在从用户接收的自然语言输入中表达的用户的意图；主动引出并获取用于充分推断用户意图所需的信息(例如，通过消除字词、游戏、意向等的歧义)；确定用于满足推断出的意图的任务流；以及执行任务流以满足推断出的意图。在一些示例中，如图7b中所示，i/o处理模块728可通过图7a中的i/o设备716与用户进行交互或通过图7a中的网络通信接口708与用户设备(例如，设备104、设备200、设备400或设备600)进行交互，以获取用户输入(例如，语音输入)并提供对用户输入的响应(例如，作为语音输出)。i/o处理模块728随同接收到用户输入一起或在接收到用户输入之后不久可任选地获取与来自用户设备的用户输入相关联的上下文信息。上下文信息可包括特定于用户的数据、词汇，和/或与用户输入相关的偏好。在一些示例中，该上下文信息还包括在接收到用户请求时的用户设备的软件状态和硬件状态，和/或与在接收到用户请求时的用户的周围环境相关的信息。在一些示例中，i/o处理模块728还可将与用户请求有关的跟进问题发送至用户，并从用户接收回答。在用户请求被i/o处理模块728接收并且用户请求可包括语音输入时，i/o处理模块728可将语音输入转发至stt处理模块730(或语音识别器)，以用于语音文本转换。stt处理模块730可包括一个或多个asr系统。该一个或多个asr系统可处理通过i/o处理模块728接收到的语音输入，以产生识别结果。每个asr系统可包括前端语音预处理器。前端语音预处理器可从语音输入提取代表性特征。例如，前端语音预处理器可对语音输入执行傅里叶变换，以提取表征语音输入的光谱特征作为代表性多维向量的序列。此外，每个asr系统可包括一个或多个语音识别模型(例如，声音模型和/或语言模型)，并且可实现一个或多个语音识别引擎。语音识别模型的示例可包括隐马尔可夫模型、高斯混合模型、深层神经网络模型、n元语言模型、以及其他统计模型。语音识别引擎的示例可包括基于动态时间规整的引擎和基于加权有限状态换能器(wfst)的引擎。一个或多个语音识别模型和一个或多个语音识别引擎可用于处理前端语音预处理器的所提取的代表性特征，以产生中间识别结果(例如，音素、音素串和子字)，并且最终产生文本识别结果(例如，字词、字词串或符号的序列)。在一些示例中，语音输入可至少部分地由第三方服务处理或在用户的设备(例如，设备104,200,400或600)上处理，以产生识别结果。一旦stt处理模块730产生包含文本串(例如，字词，或字词的序列，或符号的序列)的识别结果，识别结果便可被传送至自然语言处理模块732以用于意图推断。有关语音转文本处理的更多细节在提交于2011年9月20日的标题为“consolidatingspeechrecognitionresults”的美国实用新型专利申请序列号13/236,942中有所描述，其全部公开内容以引用方式并入本文。在一些示例中，stt处理模块730可包括可识别字词的词汇，和/或可经由语音字母转换模块731来访问该词汇。每个词汇字词可与以语音识别语音字母表来表示的字词的一个或多个候选发音相关联。具体地，可识别字词的词汇可包括与多个候选发音相关联的字词。例如，该词汇可包括与和的候选发音相关联的字词“tomato”。此外，词汇字词可与基于来自用户的先前语音输入的自定义候选发音相关联。此类自定义候选发音可被存储在stt处理模块730中，并且可经由设备上的用户配置文件而与特定用户相关联。在一些示例中，字词的候选发音可基于字词的拼写以及一个或多个语言学和/或语音学规则来确定。在一些示例中，候选发音可手动生成，例如基于已知的标准发音而手动生成。在一些示例中，可基于候选发音的普遍性来对候选发音进行排名。例如，候选发音的排序可高于因为前者是更常用的发音(例如，在所有用户中，对于特定地理区域的用户而言，或者对于任何其他合适的用户子集而言)。在一些示例中，可基于候选发音是否为与用户相关联的自定义候选发音来对候选发音进行排名。例如，自定义候选发音的排名可高于标准候选发音。这可用于识别具有偏离规范发音的独特发音的专有名词。在一些示例中，候选发音可与一个或多个语音特征(诸如地理起源、国家、或种族)相关联。例如，候选发音可与美国相关联，而候选发音可与英国相关联。此外。此外，候选发音的排名可基于被存储在设备上的用户配置文件中的用户的一个或多个特征(例如，地理起源、国家、种族等)。例如，可从用户配置文件确定该用户与美国相关联。基于用户与美国相关联，候选发音(与美国相关联)的排序可高于候选发音(与英国相关联)。在一些示例中，经排名的候选发音中的一个候选发音可被选作预测发音(例如，最可能的发音)。当接收到语音输入时，stt处理模块730可用于(例如，使用声音模型)确定对应于该语音输入的音素，并且然后尝试(例如，使用语言模型)确定匹配该音素的字词。例如，如果stt处理模块730可首先识别对应于该语音输入的一部分的音素序列则其随后可基于词汇索引744来确定该序列对应于字词“tomato”。在一些示例中，stt处理模块730可使用模糊匹配技术来确定话语中的字词。因此，例如，stt处理模块730可确定音素序列对应于字词“tomato”，即使该特定音素序列不是该字词的候选音素序列之一。在一些示例中，自然语言处理模块732可被配置为接收与语音输入相关联的元数据。元数据可指示是否对语音输入(或者对应于该语音输入的字词或符号的序列)执行自然语言处理。如果元数据指示将执行自然语言处理，则自然语言处理模块可从stt处理模块接收字词或符号的序列以执行自然语言处理。然而，如果元数据指示将不执行自然语言处理，则可禁用自然语言处理模块，并且可从数字助理输出来自stt处理模块的字词或符号的序列(例如，文本串)。在一些示例中，元数据可进一步识别对应于用户请求的一个或多个域。基于该一个或多个域，自然语言处理器可禁用知识本体760中该一个或多个域之外的域。这样，自然语言处理被约束为知识本体760中的该一个或多个域。具体地，可使用知识本体中的该一个或多个域而不是其他域来生成结构化查询(下文描述)。数字助理的自然语言处理模块732(“自然语言处理器”)可获取由stt处理模块730生成的字词或符号的序列(“符号序列”)，并尝试将该符号序列与由数字助理所识别的一个或多个“可执行意图”相关联。“可执行意图”可表示可由数字助理执行并且可具有在任务流模型754中实现的相关联的任务流的任务。相关联任务流可以是数字助理为了执行任务而采取的一系列经编程的动作和步骤。数字助理的能力范围可取决于已在任务流模型754中实施并存储的任务流的数量和种类，或换句话讲，取决于数字助理所识别的“可执行意图”的数量和种类。然而，数字助理的有效性还可取决于助理从以自然语言表达的用户请求中推断出正确的“一个或多个可执行意图”的能力。在一些示例中，除从stt处理模块730获取的字词或符号的序列之外，自然语言处理模块732还可(例如，从i/o处理模块728)接收与用户请求相关联的上下文信息。自然语言处理模块732可任选地使用上下文信息来明确、补充和/或进一步限定被包含在从stt处理模块730接收的符号序列中的信息。上下文信息可包括例如：用户偏好、用户设备的硬件和/或软件状态、在用户请求之前、期间或之后不久收集的传感器信息、数字助理与用户之间的先前交互(例如，对话)等。如本文所述，上下文信息可以是动态的，并且可随对话的时间、位置、内容以及其他因素而变化。在一些示例中，自然语言处理可基于例如知识本体760。知识本体760可以是包含许多节点的分级结构，每个节点表示“可执行意图”或与“可执行意图”或其他“属性”中的一者或多者相关的“属性”。如上所述，“可执行意图”可表示数字助理能够执行的任务，即该任务为“可执行的”或可被进行的。“属性”可表示与可执行意图或另一属性的子方面相关联的参数。知识本体760中的可执行意图节点与属性节点之间的链接可定义由属性节点表示的参数如何与由可执行意图节点表示的任务相关。在一些示例中，知识本体760可由可执行意图节点和属性节点组成。在知识本体760内，每个可执行意图节点可直接链接至或通过一个或多个中间属性节点链接至一个或多个属性节点。类似地，每个属性节点可直接链接至或通过一个或多个中间属性节点链接至一个或多个可执行意图节点。例如，如图7c所示，知识本体760可包括“餐厅预订”节点(即，可执行意图节点)。属性节点“餐厅”、“日期/时间”(针对预订)和“同行人数”各自可直接链接至可执行意图节点(即，“餐厅预订”节点)。此外，属性节点“菜系”、“价格区间”、“电话号码”和“位置”可以是属性节点“餐厅”的子节点，并且各自可通过中间属性节点“餐厅”而被链接至“餐厅预订”节点(即，可执行意图节点)。又如，如图7c所示，知识本体760还可包括“设定提醒”节点(即，另一可执行意图节点)。属性节点“日期/时间”(针对设定提醒)和“主题”(针对提醒)各自可链接至“设定提醒”节点。由于属性“日期/时间”可与进行餐厅预订的任务和设定提醒的任务两者相关，因此属性节点“日期/时间”可链接至知识本体760中的“餐厅预订”节点和“设定提醒”节点两者。可执行意图节点连同其链接的概念节点一起可被描述为“域”。在本论述中，每个域可与相应的可执行意图相关联，并涉及与特定可执行意图相关联的一组节点(以及这些节点之间的关系)。例如，图7c中示出的知识本体760可包括知识本体760内的餐厅预订域762的示例以及提醒域764的示例。餐厅预订域包括可执行意图节点“餐厅预订”、属性节点“餐厅”、“日期/时间”和“同行人数”以及子属性节点“菜系”、“价格范围”、“电话号码”和“位置”。提醒域764可包括可执行意图节点“设置提醒”以及属性节点“主题”和“日期/时间”。在一些示例中，知识本体760可由多个域组成。每个域可与一个或多个其他域共享一个或多个属性节点。例如，除了餐厅预订域762和提醒域764之外，“日期/时间”属性节点还可与许多不同域(例如，行程安排域、旅行预订域、电影票域等)相关联。尽管图7c示出了知识本体760内的两个示例域，但其他域可包括例如“查找电影”、“发起电话呼叫”、“查找方向”、“安排会议”、“发送消息”以及“提供问题的回答”、“阅读列表”、“提供导航指令”、“提供针对任务的指令”等。“发送消息”域可与“发送消息”可执行意图节点相关联，并且还可包括属性节点诸如“一个或多个接收人”、“消息类型”和“消息正文”。属性节点“接收人”可进一步例如由子属性节点诸如“接收人名称”和“消息地址”来限定。在一些示例中，知识本体760可包括数字助理能够理解并对其起作用的所有域(以及因此可执行的意图)。在一些示例中，知识本体760可诸如通过添加或移除整个域或节点，或者通过修改知识本体760内的节点之间的关系来进行修改。在一些示例中，可将与多个相关可执行意图相关联的节点群集在知识本体760中的“超级域”下。例如，“旅行”超级域可包括与旅行有关的属性节点和可执行意图节点的群集。与旅行有关的可执行意图节点可包括“航班预订”、“酒店预订”、“汽车租赁”、“路线规划”、“寻找兴趣点”等等。同一超级域(例如，“旅行”超级域)下的可执行意图节点可具有多个共用的属性节点。例如，针对“机票预订”、“酒店预订”、“汽车租赁”、“路线规划”和“寻找兴趣点”的可执行意图节点可共享属性节点“起始位置”、“目的地”、“出发日期/时间”、“到达日期/时间”和“同行人数”中的一者或多者。在一些示例中，知识本体760中的每个节点可与和由节点代表的属性或可执行意图有关的一组字词和/或短语相关联。与每个节点相关联的相应组的字词和/或短语可是所谓的与节点相关联的“词汇”。可将与每个节点相关联的相应组的字词和/或短语存储在与由节点所表示的属性或可执行意图相关联的词汇索引744中。例如，返回图7b，与“餐厅”属性的节点相关联的词汇可包括字词诸如“美食”、“酒水”、“菜系”、“饥饿”、“吃”、“披萨”、“快餐”、“膳食”等。又如，与“发起电话呼叫”可执行意图的节点相关联的词汇可包括字词和短语，诸如“呼叫”、“打电话”、“拨打”、“与……通电话”、“呼叫该号码”、“打电话给”等。词汇索引744可任选地包括不同语言的字词和短语。自然语言处理模块732可从stt处理模块730接收符号序列(例如，文本串)，并确定符号序列中的字词牵涉哪些节点。在一些示例中，如果发现符号序列中的字词或短语(经由词汇索引744)与知识本体760中的一个或多个节点相关联，则该字词或短语可“触发”或“激活”这些节点。基于已激活节点的数量和/或相对重要性，自然语言处理模块732可选择可执行意图中的一个可执行意图作为用户意图使数字助理执行的任务。在一些示例中，可选择具有最多“已触发”节点的域。在一些示例中，可选择具有最高置信度(例如，基于其各个已触发节点的相对重要性)的域。在一些示例中，可基于已触发节点的数量和重要性的组合来选择域。在一些示例中，在选择节点的过程中还考虑附加因素，诸如数字助理先前是否已正确解译来自用户的类似请求。用户数据748可包括特定于用户的信息，诸如特定于用户的词汇、用户偏好、用户地址、用户的默认语言和第二语言、用户的联系人列表、以及每位用户的其他短期或长期信息。在一些示例中，自然语言处理模块732可使用特定于用户的信息来补充用户输入中所包含的信息，以进一步限定用户意图。例如，针对用户请求“邀请我的朋友参加我的生日聚会”，自然语言处理模块732可能够访问用户数据748以确定“朋友”是哪些人以及“生日聚会”将于何时何地举行，而不需要用户在其请求中明确地提供此类信息。基于符号串搜索知识本体的其他细节在于2008年12月22日提交的标题为“methodandapparatusforsearchingusinganactiveontology”的美国实用新型专利申请序列号12/341,743中有所描述，其全部公开内容以引用方式并入本文。在一些示例中，一旦自然语言处理模块732基于用户请求而识别出可执行意图(或域)，自然语言处理模块732便可生成结构化查询，以表示所识别的可执行意图。在一些示例中，结构化查询可包括针对可执行意图的域内的一个或多个节点的参数，并且该参数中的至少一些参数填充有在用户请求中指定的特定信息和要求。例如，用户可以说“帮我在寿司店预订晚上7点的座位。”在这种情况下，自然语言处理模块732可能够基于用户输入将可执行意图正确地识别为“餐厅预订”。根据知识本体，“餐厅预订”域的结构化查询可包括参数诸如{菜系}、{时间}、{日期}、{同行人数}等。在一些示例中，基于语音输入和使用stt处理模块730从语音输入得出的文本，自然语言处理模块732可针对餐厅预订域生成部分结构化查询，其中部分结构化查询包括参数{菜系＝“寿司类”}以及{时间＝“晚上7点”}。然而，在该示例中，用户话语包含不足以完成与域相关联的结构化查询的信息。因此，基于当前可用的信息，在结构化查询中可能未指定其他必要的参数，诸如{同行人数}和{日期}。在一些示例中，自然语言处理模块732可利用所接收的上下文信息来填充结构化查询的一些参数。例如，在一些示例中，如果请求“附近的”寿司店，自然语言处理模块732可利用来自用户设备的gps坐标来填充结构化查询中的{位置}参数。在一些示例中，自然语言处理模块732可将生成的结构化查询(包括任何已完成的参数)传递给任务流处理模块736(“任务流处理器”)。任务流处理模块736可被配置为接收来自自然语言处理模块732的结构化查询、必要时完成结构化查询，并且执行“完成”用户最终请求所需的动作。在一些示例中，完成这些任务所必需的各种过程可在任务流模型754中提供。在一些示例中，任务流模型754可包括用于获取来自用户的附加信息的过程，以及用于执行与可执行意图相关联的动作的任务流。如上所述，为了完成结构化查询，任务流处理模块736可能需要发起与用户的附加对话，以便获得附加信息和/或弄清可能有歧义的话语。当有必要进行此类交互时，任务流处理模块736可调用对话流处理模块734以参与同用户的对话。在一些示例中，对话流处理模块734可确定如何(和/或何时)向用户请求附加信息，并且接收和处理用户响应。该问题可通过i/o处理模块728而被提供至用户并可从用户接收回答。在一些示例中，对话处理模块734可经由音频和/或视觉输出来向用户呈现对话输出，并接收经由口头或物理(例如，点击)响应的来自用户的输入。继续上述示例，当任务流处理模块736调用对话流处理模块734来确定针对与域“餐厅预订”相关联的结构化查询的“同行人数”和“日期”信息时，对话流处理模块734可生成问题诸如“一行几位？”和“预订哪天？”以传递给用户。一旦从用户接收到回答，对话流处理模块734便可利用缺失信息填充结构化查询，或将信息传递给任务流处理模块736以根据结构化查询来完成缺失信息。一旦任务流处理模块736已针对可执行意图完成结构化查询，任务流处理模块736便可着手执行与可执行意图相关联的最终任务。因此，任务流处理模块736可根据包含在结构化查询中的特定参数来执行任务流模型中的步骤和指令。例如，针对可执行意图“餐厅预订”的任务流模型可包括用于联系餐厅并在特定时间实际上请求针对特定同行人数的预订的步骤和指令。例如，通过使用结构化查询诸如：{餐厅预订，餐厅＝abc咖啡馆，日期＝2012/3/12，时间＝下午7点，同行人数＝5人}，任务流处理模块736可执行以下步骤：(1)登录到abc咖啡馆的服务器或餐厅预订系统诸如(2)在网站上的表格中输入日期、时间和同行人数信息，(3)提交表格，以及(4)在用户日历中针对该预订制作日历条目。在一些示例中，任务流处理模块736可在服务处理模块738(“服务处理模块”)的辅助下完成用户输入中所请求的任务或者提供用户输入中所请求的信息性回答。例如，服务处理模块738可代表任务流处理模块736来发起电话呼叫、设置日历条目、调用地图搜索、调用用户设备上安装的其他用户应用程序或与该其他应用程序进行交互、以及调用第三方服务(例如，餐厅预订门户网站、社交网站、银行门户网站等)、或与第三方服务进行交互。在一些示例中，可通过服务模型756中的相应服务模型来指定每项服务所需的协议和应用编程接口(api)。服务处理模块738可针对服务来访问适当的服务模型，并依据服务模型根据该服务所需的协议和api来生成针对该服务的请求。例如，如果餐厅已启用在线预订服务，则餐厅可提交服务模型，该服务模型指定进行预订的必要参数以及将必要参数的值传送至在线预订服务的api。在被任务流处理模块736请求时，服务处理模块738可使用被存储在服务模型中的web地址来建立与在线预订服务的网络连接，并将预订的必要参数(例如，时间、日期、同行人数)以符合在线预订服务的api的格式发送至在线预订接口。在一些示例中，自然语言处理模块732、对话处理模块734以及任务流处理模块736可被共同且反复地使用，以推断并限定用户的意图、获得信息，以进一步明确并细化用户意图并最终生成响应(即，输出至用户或完成任务)以满足用户的意图。所生成的响应可以是对语音输入的至少部分地满足用户的意图的对话响应。此外，在一些示例中，所生成的响应可被输出为语音输出。在这些示例中，所生成的响应可被发送到语音合成模块740(例如，语音合成器)，在语音合成模块中，可处理所生成的响应以将对话响应以语音形式合成。在其他示例中，所生成的响应可以是与满足语音输入中的用户请求相关的数据内容。语音合成模块740可被配置为合成语音输出以呈现给用户。语音合成模块740基于数字助理提供的文本来合成语音输出。例如，所生成的对话响应可为文本串的形式。语音合成模块740可将文本串转换成可听语音输出。语音合成模块740可使用任何合适的语音合成技术，以便从文本生成语音输出，包括但不限于：拼接合成、单位选择合成、双音素合成、特定于域的合成、共振峰合成、发音合成、基于隐马尔可夫模型(hmm)的合成、以及正弦波合成。在一些示例中，语音合成模块740可被配置为基于与这些字词对应的音素串来合成各个字词。例如，音素串可与所生成的对话响应中的字词相关联。音素串可被存储在与字词相关联的元数据中。语音合成模型740可被配置为直接处理元数据中的音素串，以合成语音形式的字词。在一些示例中，替代使用语音合成模块740(或除此之外)，可在远程设备(例如，服务器系统108)上执行语音合成，并且可将合成的语音发送至用户设备以输出给用户。例如，这可发生在一些具体实施中，其中在服务器系统处生成数字助理的输出。并且由于服务器系统通常比用户设备具有更强的处理能力或更多的资源，有可能获得比客户端侧合成将实现的质量更高的语音输出。有关数字助理的附加细节可在于2011年1月10日提交的标题为“intelligentautomatedassistant”的美国实用新型专利申请号12/987,982和于2011年9月30日提交的标题为“generatingandprocessingtaskitemsthatrepresenttaskstoperform”的美国实用新型专利申请号13/251,088中找到，其全部公开内容以引用方式并入本文。图8a至图8q根据一些实施方案示出了用于基于非特定非结构化的自然语言请求来发现媒体的示例性用户界面。这些附图中的用户界面用于示出下文描述的过程，包括图9a至图9c中的示例性过程。参考图8a，根据一些实施方案，电子设备200包括显示器212和麦克风213。如上所述，数字助理由发出经由麦克风213获取的非结构化自然语言用户输入的用户访问。用户请求的定时受用户控制。用户可在由电子设备200同时回放其他媒体期间或者在电子设备200不回放媒体时请求递送媒体。用户输入请求递送特定媒体，在该情况下为歌曲。将用户输入从语音转换为文本，并且根据一些实施方案，将文本用户输入1000显示在显示器212上。通过显示文本用户输入1000，根据一些实施方案，用户可验证数字助理已正确接收到所做出的请求。在其他实施方案诸如但不限于其中数字助理可在免持模式下操作的实施方案中，不显示文本用户输入1000。如图8a所示，用户已请求数字助理从标题为“liszt:thepianoconcertos”的专辑播放特定曲目。在一些实施方案中，专辑的至少一部分以电子形式存储在电子设备200上。在其他实施方案中，专辑的至少一部分远程地存储在电子设备200能够访问的外部设备上(“云”中)。根据一些实施方案，远程存储的内容与电子设备200和/或与用户相关联的唯一标识符相关联。在其他实施方案中，专辑的至少一部分是电子设备200能够访问的流媒体服务诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务)的一部分。在接收非结构化的自然语言用户输入请求媒体时，数字助理引发执行对该媒体的搜索，如参照图9a至图9c更详细地描述的。利用非结构化的自然语言用户输入和该输入的上下文来执行该搜索。在该实施例中，搜索找到用户请求的特定媒体—“liszt:thepianoconcertos”的曲目2，基于用户输入及其上下文确定该特定专辑满足用户请求。在一些实施方案中，用户请求的媒体是本地存在于电子设备200上、还是远程存储在服务器上，或者通过流媒体服务诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务)流传输至用户对于用户来说是透明的。如图8b所示，数字助理获得所请求的媒体。根据一些实施方案，电子设备200呈现与显示器212上的媒体相关联的标识符1002，以允许用户确认正在回放哪个媒体。根据一些实施方案，电子设备200包括媒体回放界面1004，该媒体回放界面包括标准媒体控制，诸如用于暂停媒体、播放上一曲或播放下一曲的示能表示、用于控制音量的示能表示，以及显示和/或控制媒体回放进度的示能表示。电子设备200回放所选择的媒体；这里指的是来自专辑“liszt:thepianoconcertos”的曲目2(“pianoconcerto#2ina”)。如图8c所示，用户以比参照图8a描述的更不特定的方式请求媒体。非特定非结构化的自然语言用户输入不能识别具有特殊性的特殊媒体项。例如，用户希望听与流行电影相关联的歌曲，但不知道或者记不清歌曲的名称。接收到用户输入1010：“播放来自topgun的那首歌”，其识别电影而非歌曲。图8c中做出的请求可在任何时间—在如图8b所示获得的媒体的回放期间、之后、之前做出，或者替代该媒体的回放。根据一些实施方案，将用户输入1010显示在显示器212上。在接收非特定非结构化自然语言用户输入请求媒体时，数字助理引发执行对该媒体的搜索，如参照图9a至图9c更详细地描述的。利用非结构化自然语言用户输入和该输入的上下文来执行该搜索。用户输入的上下文可包括设备上下文、用户上下文和社交上下文中的一个或多个。设备上下文包括与电子设备200自身相关联的信息。在一些实施方案中，设备上下文包括电子设备200的位置。可使用gps系统或其他系统来定位电子设备200，并且能够确定用户是否在移动、用户所在的位置(例如，住宅、学校、工作地点、公园、健身房)和其他信息。根据一些实施方案，电子设备200被配置为从gps之外的无线位置发射器诸如无线位置发射器或appleinc(cupertino,california)的ibeacon接收信号。作为一个示例，数字助理确定电子设备200以及由此的用户正以与汽车行驶一致的速率移动。根据一些实施方案，数字助理利用该信息结合与用户在汽车中最常回放的媒体相关的用户上下文(如下所述)，以便获得所请求的媒体。又如，数字助理确定电子设备200处于表演现场音乐的场所，诸如竞技场或酒吧。根据一些实施方案，作为响应，数字助理可在电子设备200所在的位置引发对音乐表演时间表的搜索，并且利用该信息来满足用户对媒体的请求。又如，当电子设备200位于用户的住宅中，并且用户在预先确定的时间量内没有移动可检测的量时，数字助理确定用户在家里看电视。根据一些实施方案，设备上下文包括来自麦克风的用户语音之外的音频输入，诸如电子设备200附近的声音。根据一些实施方案，电子设备从该声音生成声学指纹。声学指纹是从该声音生成的压缩数字摘要，其可用于通过将该声学指纹与数据库进行比较来识别该声音。在其他实施方案中，电子设备还将该声音转换为文本或相反，其中该声音包括可识别的语音。作为使用这种上下文的示例，数字助理通过诸如appleinc(cupertino,california)的apple数字媒体扩展器而非通过电子设备已经确定用户在家里看电视(如先前的段落所述)通过电子设备，数字助理基于电子设备200附近的声音来确定用户正在观看特定的电视节目。根据一些实施方案，数字助理还利用电视节目时间表信息的数据库进行此类确定。在接收到用户对媒体的请求(例如，“录制本节目的剧集”、“从节目中获得这首歌曲”)时，数字助理利用位置和环境声音信息来确定哪个媒体满足用户请求。根据另一个实施方案，又如，用户正步行穿过商场或公共空间或正坐在餐厅中，并且在本地音响系统上听到歌曲。响应于用户请求“将这首歌曲添加至我的音乐库”，数字助理可通过麦克风213听环境声音，以便确定用户的“这首歌曲”的含义。在识别歌曲时，例如，使用上述声学指纹或语音文本转换技术，数字助理可将该歌曲添加至用户库。根据一些实施方案，设备上下文包括在用户对媒体的请求的同时由电子设备200并发播放的媒体的内容。此类媒体可以是任何格式，诸如音频和/或视频。在一些实施方案中，视频和音乐播放器模块252访问与电子设备200并发播放的媒体相关联的信息，使得数字助理200可以直接访问该信息。此类信息在用户请求与电子设备并发播放的媒体相关的媒体的上下文下是有用的(例如，“播放相似歌曲”、“我想听这首歌的现场版本”)。根据一些实施方案，设备上下文包括在用户对媒体的请求的同时与电子设备200并发回放的媒体的内容相关联的时间码。根据一些实施方案，数字助理利用该时间码来确定与用户对媒体的请求并发发生的媒体中的位置。例如，如果用户在电子设备上观看视频并请求“将这个艺术家添加到我的媒体流”，数字助理访问由视频和音乐回放器模块252回放的媒体流，以确定哪个媒体正在并发播放，然后使用该媒体流的时间码来确定歌曲是否与媒体流中的该时间码相关联；如果是的话，数字助理确定该歌曲与“这个艺术家”的用户输入相关联，并确定演奏该歌曲的艺术家。根据一些实施方案，设备上下文包括与存储在电子设备200上的媒体相关联的数据。例如，数字助理推断存储在电子设备200上的媒体是用户优选的媒体，并且利用该信息确定非特定用户对媒体的请求的含义。与存储在电子设备上的媒体相关联的数据包括但不限于例如，该媒体的呈现状态，该媒体的书目信息(例如，标题、专辑、发布日期)，与该媒体的播放历史有关的信息(例如，回放该媒体的次数；该媒体最后回放的日期；该媒体被添加到电子设备的日期)以及与该媒体有关的元数据。根据一些实施方案，设备上下文包括应用程序上下文。应用程序上下文与用户正在用于媒体回放的应用程序相关。例如，数字助理确定媒体的并发回放是否是由视频和音乐模块252、在电子设备200上运行的本地应用程序、与电子设备200相关联的第三方应用程序(例如，hulullc(santamonica,california)的)或另一个应用程序执行的。应用程序上下文还包括与应用程序相关联的元数据(如果有的话)。用户上下文包括与电子设备200的用户相关联的信息。用户上下文包括请求媒体的自然语言用户输入的内容。根据一些实施方案，用户上下文包括关于用户的人口统计信息，诸如用户的年龄、性别等。在一些实施方案中，数字助理使用该信息将对媒体的请求与具有相似人口统计特征的其他用户作出的类似请求进行比较。例如，数字助理从在波士顿上大学的用户接收请求媒体的非特定非结构化自然语言用户输入。数字助理引发与波士顿其他大学生所搜寻的媒体有关的搜索，并使用该媒体在类似位置的用户中的流行度以便为用户获得媒体。根据一些实施方案，用户上下文包括与用户相关联而与媒体的存储位置无关的媒体。此类媒体可存储在云中或者可与用户可访问的流媒体音乐服务相关联，诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务)。在一些实施方案中，数字助理推断与用户相关联的媒体是用户优选的媒体，并且利用该信息确定非特定用户对媒体的请求的含义。在一些实施方案中，用户上下文还包括与媒体相关联的数据，该媒体与用户相关联，诸如但不限于该媒体的呈现状态，该媒体的曲目信息(例如，标题、专辑、发行日期)，与该媒体的回放历史有关的信息(例如，回放该媒体的次数；该媒体最后回放的日期；该媒体被添加到电子设备的日期)以及与该媒体有关的元数据。根据一些实施方案，用户上下文包括与用户的音乐偏好有关的信息。例如，用户上下文包括用户回放的媒体的历史和/或用户已经回放的某些项的次数，而不考虑这些项的存储位置。被用户频繁播放的媒体被推断为用户的优选媒体，使得当确定满足用户请求的媒体项时，由用户经常播放的匹配请求媒体的非特定自然语言用户输入的媒体被认为是更好的匹配。又如，用户上下文包括用户获得媒体的历史，而不考虑该媒体的存储位置。又如，用户上下文包括将音乐添加到用户可访问的流媒体音乐服务(诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务))的历史。根据一些实施方案，用户上下文包括与电子设备200可访问的用户内容相关联的数据。例如，用户上下文包括与用户拍摄的数字照片相关联的数据，无论该数据是存储在电子设备200上还是远程地存储并可由电子设备200访问。数字照片通常与元数据一起存储，诸如拍摄日期和拍摄地点。在接收到请求媒体的非特定自然语言用户输入时，诸如“播放我前往意大利的旅途中的热门歌曲”时，数字助理可引发执行对与意大利旅行有关的信息的搜索。在查找包括意大利内的位置的照片元数据时，数字助理确定该照片元数据中的对应的日期信息。然后，数字助理基于从照片获得的日期信息引发对历史音乐图表信息的数据库(例如，billboard(newyork,newyork)的数据库)的搜索。从这个实施例可以清楚看出，用户内容不需要与用户所搜寻的媒体的类型相关。社交上下文包括与电子设备200的用户之外的其他用户相关联的信息。作为一个示例，社交上下文包括特定媒体项已经从音乐服务(诸如appleinc.(cupertino,california)的音乐服务)流传输或下载了多少次。在一个示例中，此类流传输或下载计数在艺术家的音乐作品上执行。作为另一个示例，此类计数在专辑中执行。通过进一步举例的方式，数字助理可接收请求诸如“播放来自frozen的该歌曲”的媒体的非特定自然语言用户输入。数字助理可在appleinc.(cupertino,california)的音乐服务上引发执行搜索，以便为电影“frozen”找到原声专辑，然后确定该专辑上的哪首曲目的下载次数最大。数字助理获得专辑上具有最大下载次数的特定媒体项。作为另外一个示例，社交上下文包括特定媒体项已经从用户可访问的流媒体音乐服务(诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务))流传输了多少次。根据一些实施方案，社交上下文包括对社交媒体数据库中的媒体项的引用的数量。作为一个示例，数字助理可接收请求媒体诸如“我想听来自famousband的热门歌曲”的非特定自然语言用户输入。famousband可能已经发行了具有若干热门歌曲的流行专辑。为了消除用户的请求的歧义，数字助理可引发执行对社交数据库(例如，twitter,inc.(sanfrancisco,california)的数据库)的搜索，以便确定在最近的一段时间内(诸如过去7天或14天)特定媒体项目的提及量。数字助理获得在那段时间引用最多的来自famousband的特定媒体项。具体回到图如图8c，已经接收到用户输入1010，其识别了电影但没有识别来自该电影的所请求的歌曲：“播放topgun的那首歌”。如上文所述，数字助理识别用户输入1010的至少一个上下文。根据一些实施方案，该上下文是设备上下文、用户上下文和社交上下文中的至少一个。数字助理基于上下文和用户输入引发对媒体的搜索。例如，数字助理可在电子设备200和/或与用户相关联的媒体中搜索电影“topgun”的原声带。在发现原声带时，数字助理可确定原声带上的哪首歌曲被播放得最多，并且确定该歌曲满足对媒体的请求，之后数字助理为用户获得该歌曲。作为另外一个示例，数字助理可在音乐服务中搜索电影“topgun”的原声带。在发现原声带时，数字助理可确定原声带上的哪首歌曲被流传输或下载的次数最多，并且确定该歌曲满足对媒体的请求，之后数字助理为用户获得该歌曲。为了获得所请求的媒体，除其他过程之外，可同时执行这两个示例过程。通过并行地而不是顺序地执行过程，减少了定位媒体项的时间，尤其是在若干个过程中仅有一个过程递送满足用户请求的结果的情况下。此外，在每个并行的过程递送单个媒体项时，增强了用户请求的媒体项的置信度。更进一步地，在并行的过程递送两个或更多个单独的媒体项的情况下，数字助理对这些项应用进一步的启发式算法以确定最有可能满足用户请求的那些项。数字助理可根据一个或多个条件对每个媒体项评分，并确定具有最高分数的媒体项满足用户请求，之后数字助理为用户获得该歌曲。根据一些实施方案，评分方法偏向某些结果，诸如与存储在电子设备200上的媒体相关联的结果。在一些实施方案中，用户选择哪个条件在评分方面或多或少是重要的以便获得所请求的媒体。如图8d所示，数字助理获得所请求的媒体。根据一些实施方案，电子设备200呈现与显示器212上的媒体相关联的标识符1012，以允许用户确认正在回放哪个媒体：这里指的是电影topgun的原声专辑上来自kennyloggins的歌曲“dangerzone”。电子设备200任选地包括如上文所述的媒体回放界面1004。电子设备200回放所选择的媒体。用户心中可能有与图8d中呈现歌曲的不同的歌曲，或者用户可简单地改变他或她关于他或她想要回放哪个媒体的想法。如图8e所示，数字助理接收请求另选媒体的用户输入1020。在图8c至图8d的实施例中，另选的媒体是来自同一部电影的不同的歌曲(即，相同的原生专辑)。用户输入1020不需要被表述为请求；如图8e所示，用户输入1020指出“不，我指的是另一首歌曲”。数字助理在用户输入1020上执行语音文本转换，并根据最近请求的上下文和最近的数字助理动作来确定用户希望接收与最近获得的媒体项不同的媒体项。响应于接收到第二用户输入1020，数字助理基于上下文、用户输入和第二用户输入引发对所请求媒体的搜索。例如，数字助理可基于与第一次搜索相同的条件来引发另一次搜索，但是与第一结果匹配的媒体项(这里指歌曲“dangerzone”)被作为潜在匹配丢弃。又如，先前搜索的结果仍然被加载到可由数字助理访问的存储器中，并且数字助理从可能匹配的媒体项的列表中选择下一个最高的匹配。这种方法可能需要更多的存储容量，但可以更快地为用户提供结果。数字助理确定满足请求的至少一个附加媒体项。如图8f所示，数字助理获得满足请求的媒体。根据一些实施方案，电子设备200呈现与显示器212上的媒体相关联的标识符1022，以允许用户确认正在回放哪个媒体：这里指的是电影topgun的原声专辑上来自berlin的歌曲“takemybreathaway(来自topgun的爱情主题曲)”。电子设备200任选地包括如上文所述的媒体回放界面1004。电子设备200回放所选择的媒体。如图8g所示，数字助理接收请求另选媒体的用户输入1030。在图8e至图8f的实施例中，另选媒体是该歌曲的不同版本。在这个实施例中，不同的版本是现场版本，而不是录音室版本。在其他实施例中，不同的版本是同一艺术家的不同的录音室版本、同一艺术家的不同的现场版本或由不同的艺术家录制的同一首歌曲。数字助理以与上文参照图8e至图8f所述的相同的方式引发对另选媒体的搜索并且确定满足请求的至少一个另选媒体。如图8h所示，数字助理获得满足请求的媒体。根据一些实施方案，电子设备200呈现与显示器212上的媒体相关联的标识符1032，以允许用户确认正在回放哪个媒体：这里指的是名称为“live：sacredandprofane”的专辑中来自berlin的歌曲“takemybreathawaylive”。电子设备200任选地包括如上文所述的媒体回放界面1004。电子设备200回放所选择的媒体。根据一些实施方案，当数字助理获得媒体时，数字助理暂停已经在电子设备200上播放的媒体的并发回放，将该媒体置于有序队列中以供稍后回放，将该媒体添加到媒体库和/或采取其他动作。重新参照图8e至图8f，根据一些实施方案，数字助理基于用户输入1020确定返回的媒体项不满足用户请求。结果，根据一些实施方案，当获得另选媒体1022时，其暂停歌曲“dangerzone”的并发回放，终止“dangerzone”的回放，并用另选媒体1022的回放替换“dangerzone”的回放。通常，根据一些实施方案，当数字助理确定用户输入与请求并发播放的媒体的暂停的输入一致时，数字助理使电子设备200停止播放该媒体并将其替换为最近请求的媒体的回放。媒体可能是不同类型的媒体。例如，当在电子设备200上看电影时，用户可请求回放歌曲；数字助理将使电子设备200停止播放电影并将其替换为最近请求的媒体的回放—在这个示例中，该媒体为歌曲。根据一些实施方案，当数字助理获得媒体时，数字助理将媒体置于有序的队列中以供稍后回放。如图8j所示，数字助理接收请求“播放更多该乐队的歌曲”的用户输入1040。数字助理基于用户输入1040确定用户对先前获得的媒体项满意，因为用户希望从同一艺术家获得更多的媒体。可使用其他条件来确定用户输入1040是否与用户对与用户输入1040并发播放的媒体的满意度一致。基于该用户输入1040，数字助理基于该用户输入和该用户输入的上下文引发搜索，确定满足用户请求的一个或多个附加媒体项并获得这些一个或多个媒体项。如图8k所示，继续播放与用户输入1040并发播放的媒体。数字助理将一个或多个附加媒体项置于有序队列中以供回放。当与用户输入1040并发播放的媒体已经完成回放时，然后播放有序队列中的第一个项。根据一些实施方案，队列中的项可能来自电子设备200上的本地库，可位于电子设备外部的云中或者可以是用户可访问的流媒体音乐服务的一部分，诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务)。通常，根据一些实施方案，当数字助理确定用户输入与反映用户对并发播放的媒体的满意度的输入一致时，数字助理使电子设备200继续播放该媒体并将一个或多个附加媒体项置于有序队列中以供回放。该媒体可以是不同类型的媒体，如上文参照另一个实施方案所陈述的。根据一些实施方案，当数字助理获得媒体时，数字助理将媒体添加到与用户相关联的媒体库。在一些示例中，媒体库本地存储在电子设备200上，存储在与用户相关联的云上或者是用户可访问的流媒体音乐服务的一部分，诸如applemusic或itunesradiosm(appleinc.(cupertino,california)的服务)。例如，如图8l所示，数字助理接收请求“来自frozen的那首歌曲是什么歌曲？”的用户输入1050。数字助理基于用户输入和用户输入的至少一个上下文引发对媒体的搜索，确定满足该请求的至少一个媒体项并且获得该至少一个媒体项。在一些实施方案中，数字助理将获得的至少一个媒体项自动添加到与用户相关联的媒体库。在其他实施方案中，如图8m所示，在获得至少一个媒体项时，但是在将该至少一个媒体项添加到与用户相关联的库之前，数字助理向用户呈现将该至少一个媒体项添加到与用户相关联的库的选项。根据一些实施方案，向用户呈现所获得的至少一个媒体项的标识符1052以及显示器212上的请求1054，诸如“添加到库？”根据一些实施方案，电子设备显示与将至少一个媒体项添加到与用户相关联的库相关联的第一示能表示1056以及拒绝将至少一个媒体项添加到与用户相关联的库相关联的第二示能表示1058。响应于第一示能表示1056的用户选择，数字助理将至少一个媒体项添加到与用户相关联的库。根据一些实施方案，如图8n至图8p所示，数字助理可接收注释媒体项的用户输入。参考图8n，电子设备200正在回放媒体项1060，在本实施例中该媒体项是专辑“1970sgreatesthits”的曲目14。音频界面1004可与媒体项1060的回放并发显示在显示器212上。用户可能希望注释媒体项1060。在一些实施方案中，数字助理接收包括一个或多个字词的非结构化自然语言语音的用户输入1062，诸如“我喜欢这些歌词”或“这是什么意思？”。根据一些实施方案，用户输入1062与媒体项1060中的时间码相关联，此时接收到用户输入1062。用户输入1062从语音转换为文本，存储为语音数据或以任何其他合适的方式处理。在一些实施方案中，用户输入1062是用户给自己作的备注或是数字助理不会因其采取动作的其他信息。根据一些实施方案，如图8q所示，数字助理基于用户输入1062和用户输入1062的上下文引发执行搜索。在其他实施方案中，数字助理在接收到来自用户的明确请求之前不会引发搜索的执行。响应于搜索，数字助理在显示器212上向用户提供搜索结果1064。在该实施例中，用户输入1062与媒体项1060在特定时间码的歌词的含义相关，并且数字助理诸如通过参考歌词数据库来确定歌词的含义。图9a至图9c示出了根据各种示例的用于操作数字助理的过程900。更具体地讲，过程900可实现为使用数字助理基于非特定自然语言用户输入来执行媒体发现。可使用实施了数字助理的一个或多个电子设备来执行过程900。在一些示例中，过程900可使用实现数字助理的客户端-服务器系统(例如，系统100)执行。过程900的各个框可以以任何合适的方式分布于一个或多个计算机、系统或电子设备中。例如，在一些示例中，过程900可完全在电子设备(例如，设备104、200、400或600)上执行。本文档中对任何一个特定的电子设备(104、200、400或600)的引用应被理解为涵盖所有的电子设备(104、200、400或600)，除非这些电子设备(104、200、400或600)中的一个或多个被本文的明确含义排除在外。例如，在若干个实施例中使用的电子设备(104、200、400或600)是智能电话。然而，过程900并不限于与智能电话一起使用；过程900可在任何其他合适的电子设备(诸如平板电脑、台式计算机、膝上型电脑或智能手表)上实现。拥有更强计算能力和更长电池寿命的电子设备可执行更多过程900的框。过程900的框的分布不需要是固定的，并且可以根据网络连接带宽、网络连接质量、服务器负载、电子设备(例如，104、200、400、600)处的计算机功率和电池功率的可用性和/或其他因素而变化。此外，虽然以下讨论将过程900描述为由数字助理系统(例如，系统100和/或数字助理系统700)执行，但是应当认识到，该过程或过程的任何特定部分不限于任何特定设备、设备的组合或实施来执行。该过程的描述由图8a至图8q进一步示出和例证，并且上文的描述与这些附图有关。图9a至图9c是示出了根据一些实施方案的用于使用数字助理和电子设备(104、200、400或600)基于非特定非结构化的自然语言请求来发现媒体的方法的流程图900。过程900中的一些操作可被组合，一些操作的次序可被改变并且一些操作可被省略。具体地讲，如果有的话，图9a至图9c中以虚线形状指示的可选操作可以以任何合适的顺序执行，并且不需要按照图9a至图9c所示的顺序执行。如下所述，方法900提供了一种用于基于使用数字助理的非特定非结构化的自然语言请求来发现媒体的直观方式。该方法减小了用于用户基于使用数字助理的非特定非结构化的自然语言请求来发现媒体所造成的认知负担，从而创建了更有效的人机界面。对于电池驱动的计算设备，使得用户能够使用数字助理基于非特定非结构化的自然语言请求更快更高效地发现媒体节省了功率并增加了电池两次充电之间的时间间隔。过程900的开始，数字助理接收与对媒体的请求相关联的用户输入，其中用户输入包括非结构化自然语言语音，该非结构化自然语言语音包括一个或多个字词。在电子设备(例如，104、200、400、600)包括麦克风213或者与麦克风相关联的情况下，可通过麦克风213接收该用户输入。用户输入也可称为音频输入或音频流。在一些实施方案中，音频流可作为原始声波，作为音频文件或以代表性的音频信号(模拟或数字)的形式被接收。在其他实施方案中，可在远程系统(诸如数字助理的服务器部件)处接收音频流。音频流可包括用户语音，诸如语音用户请求。用户输入可包括授权用户的语音用户请求。在一个示例中，可从与电子设备(104,200,400,600)紧密关联的用户(例如，用户设备的所有者或主要用户)接收用户输入。在替代实施方案中，以文本形式而非语音接收用户输入。在一些实施方案中，音频流在由数字助理分析之前或分析期间通过asr处理从语音转换为文本。此类转换可如上文所述执行，诸如在本文档的[0175]段落及以下的段落中描述的。数字助理识别与用户输入相关联的至少一个上下文(904)。如上文参照图8a至图8q所陈述的，根据一些实施方案，该上下文包括设备上下文、用户上下文和社交上下文中的一个或多个。每个上下文的示例及其在媒体发现中的使用也在上文中作了陈述。在识别与用户输入相关联的至少一个上下文之后，数字助理基于该至少一个上下文和用户输入发起对所请求的媒体的搜索(906)。在一些实施方案中，搜索由数字助理自身执行。在其他实施方案中，数字助理从执行搜索的单独实体请求搜索并将结果返回给数字助理。在一些实施方案中，搜索由数字助理自身执行并且由数字助理从单独实体请求执行搜索。通过并行地执行两个搜索，减少了对用户请求的响应时间(902)。根据一些实施方案，框906的搜索可在电子设备(例如，104、200、400、600)上本地执行。根据其他实施方案，框906的搜索可远程地执行到电子设备(例如，104、200、400、600)。远程执行到电子设备(例如，104、200、400、600)的搜索可在包括关于搜索的信息或者拥有关于搜索的信息访问权限的服务器上执行，诸如用于音频指纹信息的shazamentertainmentlimited(london,unitedkingdom)的服务器，用于历史音乐信息的billboardmagazine(newyork,newyork)的服务器和/或apple,inc.(cupertino,california)的服务器。在一些实施方案中，搜索可本地执行和远程地执行到电子设备(例如，104、200、400、600)。通过并行地执行多个搜索，减少了对用户请求的响应时间(902)。数字助理基于至少一个上下文和用户输入确定满足该请求的至少一个媒体项(908)。数字助理以任何合适的方式做出这个确定。根据一些实施方案，数字助理选择超过预先确定的阈值的第一匹配。数字助理基于至少一个上下文和用户输入确定至少一个媒体项满足请求的概率(910)。接下来，数字助理确定该概率是否超过阈值(912)。在一些实施方案中，阈值可以是预先确定的。在其他实施方案中，阈值可由用户调整。在其他实施方案中，阈值可以是动态变量。如果媒体项超过阈值，则过程900前进至下一个框918。根据一些实施方案，数字助理选择若干个候选匹配中的最佳匹配。数字助理基于至少一个上下文和用户输入确定至少一个媒体项满足请求的概率(914)。接下来，数字助理选择具有最高概率的媒体项，并前进至下一个框918。上文相对于图8a至图8q还提供了基于至少一个上下文和用户输入的满足框902的请求的至少一个媒体项的确定的实施例。根据确定至少一个媒体项满足请求，数字助理获得该至少一个媒体项(918)。根据一些实施方案，数字助理可以若干种方式获得该至少一个媒体项。作为一个示例，数字助理将获得的至少一个媒体项自动添加到与用户相关联的媒体库(920)，如上文参照图8a至图8q所述。作为另一示例，数字助理向用户呈现将获得的媒体添加到与用户相关联的媒体库的选项(922)，并且响应于用户选择将获得的媒体添加到与用户相关联的媒体库的选项，将获得的媒体添加到与用户相关联的媒体库(924)。上文描述了该过程，具体参考图8l至图8m以及说明书中随附的文本。作为另一示例，数字助理将获得的媒体置于有序队列中(926)，并且然后根据队列播放该媒体(928)。上文描述了该过程，具体参考图8j至图8k以及说明书中随附的文本。根据一些实施方案，在获得框918中，数字助理可确定本地库是否包括该至少一个媒体项(930)。本地库位于电子设备(例如，104,200,400,600)上。通过首先搜索本地库，或者并行地引发外部搜索，当所请求的项目位于电子设备(例如，104,200,400,600)上时，减少了满足用户请求所需的时间量。如果数字助理确定本地库包括该至少一个媒体项，数字助理向用户呈现该至少一个媒体项(932)。如果数字助理确定本地库不包括该至少一个媒体项，数字助理从外部数据源获得该至少一个媒体项(934)。在一些实施方案中，结合获得该至少一个媒体项(918)，或者在获得媒体项(918)之后，数字助理播放媒体项(936)。在一些情况下，在数字助理确定用户希望中断其他媒体的同时回放的情况下，数字助理终止其他媒体的同时回放(938)，如上文参照图8a至图8q所述。根据一些实施方案，在获得媒体项之后，数字助理接收包括非结构化的自然语言语音的第二用户输入，该非结构化的自然语言语音包括一个或多个字词(940)。数字助理利用一个或多个字词注释媒体项(942)。在一些实施方案中，如果用户仅仅希望制作并保留与媒体项相关联的注解，则该过程在此停止。在其他实施方案中，该过程继续，并且数字助理基于注释引发执行搜索(944)。在接收到搜索结果时，数字助理向用户呈现搜索结果(946)。上文描述了该过程，具体参考图8n至图8q以及说明书中随附的文本。根据一些实施方案，数字助理接收请求用户资料的第二用户输入(948)。作为一个示例，这可当数字助理最初获得不匹配用户的请求的媒体项时发生。上文描述了该情况，具体参考图8e至图8f以及说明书中随附的文本。作为另一示例，这可当数字助理最初获得匹配用户的请求的媒体项，但用户希望听不同媒体时发生。上文描述了该情况，具体参考图8g至图8h以及说明书中随附的文本。响应于接收到第二用户输入，数字助理基于至少一个上下文、用户输入和第二用户输入引发对媒体的搜索(950)。作为一个示例，用户输入和第二用户输入的组合提供了用于确定媒体项的附加搜索条件。作为另一示例，用户输入和第二用户输入的组合允许数字助理当评估搜索结果时排除最初结果。数字助理基于至少一个上下文、用户输入和第二用户输入确定满足该请求的至少一个附加媒体项(952)。根据确定至少一个附加媒体项满足请求，数字助理获得该至少一个附加媒体项(954)。此外，根据一些实施方案，基于例如至少一个上下文、用户输入和请求用户资料的第二用户输入，媒体项满足对媒体的请求的概率可随时间被更新。根据一些实施方案，图10示出了根据各种所述实施方案的原理进行配置的电子设备1000的示例性功能框图。根据一些实施方案，电子设备1000的功能块被配置为执行上文所述的技术。设备1000的功能块任选地由执行各种所述实施例的原理的硬件、软件或硬件和软件的组合来实现。本领域的技术人员应当理解，图10中所述的功能块任选地被组合或被分离为子块，以实现各种所述实施例的原理。因此，本文的描述任选地支持本文所述的功能块的任何可能的组合或分离或进一步限定。如图10中所示，电子设备1000包括被配置为显示图形用户界面的显示单元1002，任选地包括被配置为接收接触的触敏表面单元1004，被配置为接收音频信号的麦克风单元1006以及耦接至显示单元1002以及任选地耦接至触敏表面单元1004和麦克风单元1006的处理单元1008。在一些实施方案中，处理单元1008包括接收单元1010、识别单元1012、引发单元1014、确定单元1016、获得单元1018以及播放单元1020。处理单元被配置为(例如，利用接收单元1010)接收与对媒体的请求相关联的用户输入，所述用户输入包括非结构化自然语言语音，所述非结构化自然语言语音包括一个或多个字词；(例如，利用识别单元1012)识别与用户输入相关联的至少一个上下文；基于至少一个上下文和用户输入(例如，利用引发单元1014)引发对媒体的搜索；基于至少一个上下文和用户输入(例如，利用确定单元1016)确定满足请求的至少一个媒体项；并且根据确定至少一个媒体项满足请求，(例如，利用获得单元1018)获得至少一个媒体项。在一些实施方案中，引发单元被进一步配置为(例如，利用引发单元1014)使得搜索在设备上本地执行。在一些实施方案中，引发单元被进一步配置为(例如，利用引发单元1014)使得搜索被远程执行到设备。在一些实施方案中，处理单元被进一步配置为(例如，利用确定单元1016)确定本地库是否包括媒体项；根据确定本地库包括媒体项，向用户(例如，利用播放单元1020)呈现媒体项；根据确定本地库不包括媒体项，从外部数据源(例如，利用获得单元1018)获得媒体项。在一些实施方案中，处理单元被进一步配置为(例如，利用接收单元1010)接收请求另选的媒体的第二用户输入；响应于接收到第二用户输入，基于至少一个上下文、用户输入和第二用户输入(例如，利用引发单元1014)引发对媒体的搜索；基于至少一个上下文、用户输入和第二用户输入(例如，利用确定单元1016)确定满足请求的至少一个附加媒体项；并且根据确定至少一个附加媒体项满足请求，(例如，利用获得单元1018)获得至少一个附加媒体项。在一些实施方案中，与用户输入相关联的至少一个上下文包括设备上下文。在一些实施方案中，设备上下文包括设备的位置。在一些实施方案中，设备上下文包括设备与无线位置发射器的接近度。在一些实施方案中，设备上下文包括由设备并发播放的媒体的内容。在一些实施方案中，设备上下文包括与设备并发播放的媒体相关联的时间码。在一些实施方案中，设备上下文包括来自麦克风的用户语音之外的音频输入。在一些实施方案中，设备上下文包括与存储在设备上的媒体相关联的数据。在一些实施方案中，设备上下文包括应用程序上下文。在一些实施方案中，与用户输入相关联的至少一个上下文包括用户上下文。在一些实施方案中，用户上下文包括用户输入的内容。在一些实施方案中，用户上下文包括与用户相关联的媒体。在一些实施方案中，用户上下文包括关于用户的人口统计信息。在一些实施方案中，用户上下文包括与用户的音乐偏好有关的信息。在一些实施方案中，用户上下文包括与设备可访问的用户内容相关联的数据。在一些实施方案中，与用户输入相关联的至少一个上下文包括社交上下文。在一些实施方案中，社交上下文包括跨多个用户的特定媒体项的访问频率。在一些实施方案中，社交上下文包括对社交媒体数据库中的媒体项的引用的数量。在一些实施方案中，媒体项为歌曲。在一些实施方案中，处理单元被进一步配置为响应于获得至少一个媒体项，(例如，利用播放单元1020)播放至少一个媒体项并(例如，利用播放单元1020)终止其他媒体的并发回放。在一些实施方案中，处理单元被进一步配置为响应于获得媒体项，将至少一个获得的媒体项(例如，利用播放单元1020)置于有序队列中；并且根据队列(例如，利用播放单元1020)播放该至少一个媒体项。在一些实施方案中，获得单元被进一步配置为将至少一个媒体项添加到与用户相关联的媒体库。在一些实施方案中，处理单元还被进一步配置为(例如，利用显示单元1002)向用户呈现将至少一个媒体项添加到与用户相关联的媒体库的选项；并且响应于用户选择将至少一个媒体项添加到与用户相关联的媒体库的选项，(例如，利用获得单元1018)将至少一个媒体项添加到与用户相关联的媒体库。在一些实施方案中，处理单元被进一步配置为在获得媒体项之后，(例如，利用接收单元1010)接收包括非结构化自然语言语音的第二用户输入，所述非结构化自然语言语音包括一个或多个字词；并且利用所述一个或多个字词(例如，利用处理单元1008)注释媒体项。在一些实施方案中，处理单元被进一步配置为(例如，利用引发单元1014)基于所述注释执行搜索；并且(例如，利用显示单元1002)向用户呈现搜索结果。在一些实施方案中，确定单元还被进一步配置为基于至少一个上下文和用户输入(例如，利用确定单元1016)确定至少一个媒体项满足请求的概率；并且(例如，利用确定单元1016)确定该概率是否超过阈值。在一些实施方案中，确定单元还被进一步配置为基于至少一个上下文和用户输入(例如，利用确定单元1016)确定至少一个媒体项满足请求的概率；并且(例如，利用确定单元1016)选择具有最高概率的媒体项。在一些实施方案中，接收单元被进一步配置为接收包括至少一个媒体项的流式音频。以上参考图9a至图9c所述的操作任选地由图1a至图7c或图10中描绘的部件来实现。类似地，本领域的普通技术人员会清楚地知道可如何基于图1a至图7c或图10中所描绘的部件来实现其他过程。出于解释的目的，前面的描述是通过参考具体实施方案来描述的。然而，上面的示例性讨论并非旨在是穷尽的，也并非旨在将本发明限制为所公开的精确形式。根据以上教导内容，很多修改形式和变型形式都是可能的。选择并描述这些实施方案是为了最好地解释这些技术的原理及其实际应用。本领域的其他技术人员由此能够最好地利用这些技术以及具有适合于所设想的特定用途的各种修改的各种实施方案。虽然参照附图对本公开以及示例进行了全面的描述，但应当注意，各种变化和修改对于本领域内的技术人员而言将变得显而易见。应当理解，此类变化和修改被认为被包括在由权利要求书所限定的本公开和示例的范围内。如上文所述，本发明技术的一个方面在于采集和使用得自各种来源的数据，以改进向用户递送其可能感兴趣的内容。本公开设想，在某些情况下，该所采集的数据可包括唯一地识别或可用于联系或定位特定人员的个人信息数据。此类个人信息数据可包括人口数据、基于位置的数据、电话号码、电子邮件地址、家庭地址或任何其他识别信息。本公开认识到在本发明技术中使用此类个人信息数据可用于使用户受益。例如，该个人信息数据可用于递送用户较感兴趣的目标内容。因此，使用此类个人信息数据使得能够对所递送的内容进行有计划的控制。此外，本公开还设想个人信息数据有益于用户的其他用途。本公开还设想负责此类个人信息数据的收集、分析、公开、发送、存储或其他用途的实体将遵守已确立的隐私政策和/或隐私实践。具体地，此类实体应当实行并坚持使用被公认为满足或超出对维护个人信息数据的隐私性和安全性的行业或政府要求的隐私政策和实践。例如，来自用户的个人信息应当被收集用于实体的合法且合理的用途，并且不在这些合法使用之外共享或出售。另外，此类收集应当仅在用户知情同意之后进行。另外，此类实体应采取任何所需的步骤，以保障和保护对此类个人信息数据的访问，并且确保能够访问个人信息数据的其他人遵守他们的隐私政策和程序。另外，这种实体可使其本身经受第三方评估以证明其遵守广泛接受的隐私政策和实践。不管前述情况如何，本公开还预期用户选择性地阻止使用或访问个人信息数据的实施方案。即本公开预期可提供硬件元件和/或软件元件，以防止或阻止对此类个人信息数据的访问。例如，就广告递送服务而言，本发明的技术可被配置为在注册服务期间允许用户选择“加入”或“退出”参与对个人信息数据的收集。又如，用户可选择不为目标内容递送服务提供位置信息。再如，用户可选择不提供精确的位置信息，但准许传输位置区域信息。因此，虽然本公开广泛地覆盖了使用个人信息数据来实现一个或多个各种所公开的实施方案，但本公开还设想各种实施方案也可在无需访问此类个人信息数据的情况下被实现。即，本发明技术的各种实施方案不会由于缺少此类个人信息数据的全部或一部分而无法正常进行。例如，可通过基于非个人信息数据或绝对最低限度的个人信息诸如与用户相关联的设备所请求的内容、对内容递送服务可用的其他非个人信息或公开可用信息来推断偏好，从而选择内容并递送给用户。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：R·M·奥尔;D·J·曼德尔;A·J·西内西欧;C·J·巴内特
技术所有人：苹果公司
我是此专利的发明人

上一篇：用于查询数据源的系统和方法与流程
上一篇：估计用于运行数据挖掘服务的计算资源的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。