旅行情况下基于增强现实的语音翻译的制作方法

文档序号:33666603发布日期:2023-03-29 11:47阅读:37来源:国知局
旅行情况下基于增强现实的语音翻译的制作方法
旅行情况下基于增强现实的语音翻译
1.优先权要求
2.本技术要求于2021年4月8日提交的美国申请序列第17/225,563号的优先权的权益,该美国申请要求于2020年6月30日提交的美国临时申请序列第63/046,114号的优先权的权益,该美国临时申请通过引用其整体并入本文中。
技术领域
3.本公开内容总体上涉及消息系统,其包括提供增强现实内容与捕获图像。


背景技术:

4.消息系统提供用户之间的消息内容的交换。例如,消息系统允许用户与一个或更多个其他用户交换消息内容(例如,文本、图像)。
附图说明
5.在不一定按比例绘制的附图中,相同的标号可以在不同的视图中描述类似的部件。为了容易地识别对任何特定元件或动作的讨论,附图标记中的最高有效数字指的是该元件首次被引入的图号。在附图的各图中,通过示例而非限制的方式示出了一些实施方式。
6.图1是根据一些示例实施方式的其中可以部署本公开内容的联网环境的图解表示。
7.图2是根据一些示例实施方式的具有客户端侧功能和服务器侧功能两者的消息系统的图解表示。
8.图3是根据一些示例实施方式的如在数据库中维护的数据结构的图解表示。
9.图4是根据一些示例实施方式的消息的图解表示。
10.图5是示出根据一些示例实施方式的用于与旅行相关联地提供与语音翻译相对应的增强现实内容的过程的交互图。
11.图6a示出了根据一些示例实施方式的其中用于基于增强现实的语音翻译的语音输入的源对应于设备用户的示例用户界面。
12.图6b示出了根据一些示例实施方式的用于为由设备用户提供的语音输入提供基于增强现实的语音翻译的示例用户界面。
13.图7a示出了根据一些示例实施方式的其中用于基于增强现实的语音翻译的语音输入的源对应于不同于设备用户的个体的示例用户界面。
14.图7b示出了根据一些示例实施方式的用于为由不同于设备用户的个体提供的语音输入提供基于增强现实的语音翻译的示例用户界面。
15.图8a示出了根据一些示例实施方式的用于为由电视提供的语音输入提供基于增强现实的语音翻译的示例用户界面。
16.图8b示出了根据一些示例实施方式的用于为由电视提供的语音输入提供基于增强现实的语音翻译的另一示例用户界面。
17.图9是示出根据一些示例实施方式的用于与旅行相关联地提供与语音翻译相对应的增强现实内容的过程的流程图。
18.图10是根据一些示例实施方式的访问限制过程的流程图。
19.图11是根据一些示例实施方式的计算机系统形式的机器的图解表示,在该机器内可以执行一组指令以使该机器执行本文所讨论的方法中的任何一个或更多个。
20.图12是示出根据一些示例实施方式的软件架构的框图,在该软件架构内可以实现示例。
具体实施方式
21.消息系统通常允许用户在消息线程中彼此交换内容项(例如,消息、图像和/或视频)。消息系统可以实现增强系统或以其他方式与增强系统协同工作以增强与消息相关联的媒体内容。例如,增强系统可以将覆盖、过滤器和/或增强现实内容与由设备摄像装置捕获的图像数据组合。然而,用户可能希望在旅行时便于增强现实内容的创建和/或选择。
22.所公开的实施方式提供了与旅行相关联地呈现与语音翻译相对应的增强现实内容。响应于执行扫描操作的用户请求,消息客户端确定与请求相关联的旅行参数和图像中描绘的对象的属性。
23.消息客户端基于旅行参数和/或属性选择增强现实内容项(例如,对应于增强现实体验)。增强现实内容项被配置成基于与请求相关联的语音输入来呈现增强现实内容。消息客户端获得语音输入的转录和/或翻译,并且与图像相关联地呈现增强现实内容项,增强现实内容项包括转录或翻译中的至少一个。
24.图1是示出用于通过网络交换数据(例如,消息和相关联的内容)的示例消息系统100的框图。消息系统100包括客户端设备102的多个实例,每个实例托管包括消息客户端104的多个应用。每个消息客户端104经由网络106(例如,因特网)通信地耦接至消息客户端104的其他实例和消息服务器系统108。
25.消息客户端104能够经由网络106与另一消息客户端104和消息服务器系统108通信并交换数据。在消息客户端104之间以及消息客户端104与消息服务器系统108之间交换的数据包括功能(例如,激活功能的命令)以及有效载荷数据(例如,文本、音频、视频或其他多媒体数据)。
26.消息服务器系统108经由网络106向特定消息客户端104提供服务器侧功能。虽然消息系统100的某些功能在本文中被描述为由消息客户端104或由消息服务器系统108执行,但是某些功能的在消息客户端104或消息服务器系统108内的定位可以是设计选择。例如,在技术上优选的可能是:最初将某些技术和功能部署在消息服务器系统108内,但是后面将该技术和功能迁移至客户端设备102具有足够处理能力的消息客户端104。
27.消息服务器系统108支持向消息客户端104提供的各种服务和操作。这样的操作包括向消息客户端104发送数据、从消息客户端104接收数据以及对由消息客户端104生成的数据进行处理。作为示例,该数据可以包括消息内容、客户端设备信息、地理定位信息、媒体增强和覆盖、消息内容持续条件、社交网络信息和实况事件信息。通过经由消息客户端104的用户接口(ui)可用的功能来激活和控制消息系统100内的数据交换。
28.现在具体地转至消息服务器系统108,应用程序接口(api)服务器110耦接至应用
服务器114并向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器122,数据库服务器122便于对数据库124的访问,该数据库124存储与通过应用服务器114处理的消息相关联的数据。类似地,web服务器112耦接至应用服务器114,并且向应用服务器114提供基于web的接口。为此,web服务器112通过超文本传输协议(http)和若干其他相关协议处理传入的网络请求。
29.应用程序接口(api)服务器110在客户端设备102与应用服务器114之间接收和发送消息数据(例如,命令和消息有效载荷)。具体地,应用程序接口(api)服务器110提供一组接口(例如,例程和协议),消息客户端104可以调用或查询该组接口以激活应用服务器114的功能。应用程序接口(api)服务器110显露由应用服务器114支持的各种功能,包括:账户注册;登录功能;经由应用服务器114将消息从特定消息客户端104发送至另一消息客户端104;将媒体文件(例如,图像或视频)从消息客户端104发送至消息服务器116并用于另一消息客户端104的可能访问;媒体数据集合(例如,故事)的设置;检索客户端设备102的用户的朋友列表;检索这样的集合;检索消息和内容;在实体图(例如,社交图)中添加和删除实体(例如,朋友);在社交图中定位朋友;以及打开应用事件(例如,与消息客户端104有关)。
30.应用服务器114托管多个服务器应用和子系统,包括例如消息服务器116、图像处理服务器118以及社交网络服务器120。消息服务器116实现了多个消息处理技术和功能,特别是与从消息客户端104的多个实例接收到的消息中包括的内容(例如,文本和多媒体内容)的聚合和其他处理有关的消息处理技术和功能。如将进一步详细地描述的,来自多个源的文本和媒体内容可以被聚合成内容的集合(例如,被称为故事(story)或图库(gallery))。然后,使这些集合对消息客户端104可用。鉴于对这样的处理的硬件要求,也可以由消息服务器116在服务器侧执行数据的其他处理器和存储器密集型处理。
31.应用服务器114还包括图像处理服务器118,该图像处理服务器118专用于执行各种图像处理操作,通常相对于在从消息服务器116发送或者在消息服务器116处接收的消息的有效载荷内的图像或视频,执行各种图像处理操作。
32.社交网络服务器120支持各种社交联网功能和服务并使这些功能和服务可用于消息服务器116。为此,社交网络服务器120维护和访问数据库124内的实体图304(如图3所示)。社交网络服务器120所支持的功能和服务的示例包括识别消息系统100中的与特定用户具有关系或该特定用户正在“关注”的其他用户,以及识别特定用户的兴趣和其他实体。
33.图2是示出根据一些示例的关于消息系统100的进一步细节的框图。具体地,消息系统100被显示为包括消息客户端104和应用服务器114。消息系统100包含多个子系统,这些子系统在客户端侧由消息客户端104支持并且在服务器侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、对象检测系统212和/或转录和翻译系统212。
34.短暂定时器系统202负责施行由消息客户端104和消息服务器116对内容进行临时或限时访问。短暂定时器系统202包含多个定时器,这些定时器基于与消息或消息集合(例如,故事)相关联的持续时间和显示参数,选择性地实现经由消息客户端104访问(例如,用于呈现和显示)消息和相关联的内容。下面提供关于短暂计时器系统202的操作的另外的细节。
35.集合管理系统204负责管理媒体的合集或集合(例如,文本、图像视频和音频数据
的集合)。可以将内容(例如,消息,包括图像、视频、文本和音频)的集合组织成“事件图库”或“事件故事”。可以使这样的集合在例如与内容有关的事件的持续时间的指定的时间段内可用。例如,可以在音乐会的持续时间内使与音乐会有关的内容作为“故事”可用。集合管理系统204还可以负责向消息客户端104的用户接口发布提供特定集合存在的通知的图标。
36.此外,集合管理系统204还包括允许集合管理器管理和策展内容的特定集合的策展接口206。例如,策展接口206使得事件组织者能够策展与特定事件有关的内容的集合(例如,删除不适当的内容或冗余消息)。此外,集合管理系统204采用机器视觉(或图像识别技术)和内容规则来自动地策展内容集合。在某些示例中,可以为将用户生成的内容包括到集合中向用户支付补偿。在这样的情况下,集合管理系统204进行操作以自动地为使用用户的内容向这样的用户进行支付。
37.增强系统208提供使得用户能够增强(例如,注释或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如,增强系统208提供与生成和发布用于由消息系统100处理的消息的媒体覆盖(media overlay)有关的功能。增强系统208基于客户端设备102的地理定位可操作地向消息客户端104提供媒体覆盖或增强(例如,图像过滤器)。在另一示例中,增强系统208基于诸如客户端设备102的用户的社交网络信息的其他信息可操作地向消息客户端104供应媒体覆盖。媒体覆盖可以包括音频和视觉内容以及视觉效果。音频和视觉内容的示例包括图片、文本、标志、动画和声音效果。视觉效果的示例包括颜色覆盖。音频和视觉内容或视觉效果可以应用于客户端设备102处的媒体内容项(例如,照片)。例如,媒体覆盖可以包括可以覆盖在由客户端设备102拍摄的照片之上的文本或图像。在另一示例中,媒体覆盖包括定位标识(例如,威尼斯海滩)覆盖、实况事件的名称或商家名称(例如,海滩咖啡馆)覆盖。在另一示例中,增强系统208使用客户端设备102的地理定位来标识包括在客户端设备102的地理定位处的商家的名称的媒体覆盖。媒体覆盖可以包括与商家相关联的其他标记。媒体覆盖可以存储在数据库124中并通过数据库服务器122访问。
38.在一些示例中,增强系统208提供基于用户的发布平台,该基于用户的发布平台使得用户能够选择地图上的地理定位并上传与所选择的地理定位相关联的内容。用户还可以指定应当向其他用户提供特定媒体覆盖的情况。增强系统208生成包括所上传的内容并将所上传的内容与所选择的地理定位相关联的媒体覆盖。
39.在其他示例中,增强系统208提供基于商家的发布平台,该平台使商家能够选择经由竞标处理与地理定位相关联的特定媒体覆盖。例如,增强系统208将最高竞价商家的媒体覆盖与对应地理定位相关联达预定义时间量。
40.地图系统210提供各种地理定位功能,并且支持由消息客户端104呈现基于地图的媒体内容和消息。例如,地图系统210使得能够在地图上显示(例如,相关联地存储在如下所述的简档数据302中的)用户图标或化身,以指示用户的“朋友”的当前或过去位置,以及由这些朋友在地图的上下文内生成的媒体内容(例如,包括照片和视频的消息的集合)。例如,在消息客户端104的地图界面上,可以将用户从特定地理定位发布到消息系统100的消息在地图的该特定位置的上下文内显示给特定用户的“朋友”。用户还可以经由消息客户端104与消息系统100的其他用户(例如,使用如本文所述的适当的状况化身)共享他的或她的定位和状况信息,该定位和状况信息类似地在消息客户端104的地图界面的上下文内被显示给所选择的用户。
41.对象检测系统212在消息系统100的上下文中提供各种对象检测功能。对象检测系统212可以采用一个或更多个对象分类器来识别在捕获图像中描绘的对象。图像可以对应于由客户端设备102的摄像装置(例如,后置摄像装置或前置摄像装置)捕获的实况视频馈送。替选地或另外,图像可以对应于与客户端设备102(例如,照片库)的用户相关联地存储的图像(例如,照片)。
42.在一个或更多个实施方式中,对象检测系统212被配置成实现或以其他方式访问被配置成扫描捕获图像的对象识别算法(例如,包括机器学习算法),并且检测/跟踪图像内的对象的移动。作为非限制性示例,图像内的可检测对象包括:人脸、人体的部位、动物及其部位、风景、自然对象、非生命对象(例如,建筑物、商店门面、食物、衣物、椅子、书、汽车、建筑、其他结构)、对象的说明(例如,在海报和/或传单上)、基于文本的对象、基于方程的对象等。
43.另外,对象检测系统212被配置成确定或以其他方式访问对象的属性。对于特定对象,对象检测系统212可以确定或检索属性,该属性例如是名称/类型、流派、颜色、大小、形状、纹理、环境因素(例如,地理定位、时间、天气)和/或其他补充信息(例如,与媒体相对应的对象的歌曲标题/艺术家)。
44.关于环境因素,对象检测系统212可以从消息客户端104接收信息以识别客户端设备102周围的天气、地理定位、时间等(例如,经由设备传感器)。对象检测系统212可以基于相关性(例如基于属性与一个或更多个环境因素的关联),对检索到的属性进行排名。可以采用其他机器学习技术来选择和排序所检索的属性。对象检测系统212可以从在捕获图像中检测到的对象列表中选择与最高排名的属性相关联的对象,并且可以向消息客户端104发送所选择的对象的指示。替选地或另外,对象检测系统212可以提供将每个检测到的对象的一个或更多个属性(例如,名称/类型)和/或属性的排名的指示传送到消息客户端104。
45.在一个或更多个实施方式中,对象检测系统212确定属性之一对应于已经由第三方赞助的关键字。例如,第三方可以赞助或支付比其他关键字排名更高的某些关键字。响应于确定给定属性对应于赞助关键词,对象检测系统212可以提供该属性相对于其他属性的更高排名。
46.转录和翻译系统214被配置成提供与语音识别、转录和/或翻译有关的各种功能。在一个或更多个实施方式中,转录和翻译系统214被配置成接收语音输入(例如,经由设备麦克风)。转录和翻译系统214可以将自动语音识别(asr)算法或其他已知技术应用于语音输入,并且提供机器编码文本作为输出。在一个或更多个实施方式中,转录和翻译系统214提供例如与整个语音输入相对应的转录形式的机器编码文本。替选地或另外,转录和翻译系统214可以提供从语音输入导出的一个或更多个基于文本的关键词形式的机器编码文本。
47.转录和翻译系统214还提供与语言翻译有关的各种功能。在一个或更多个实施方式中,转录和翻译系统214被配置成实现或以其他方式访问用于将文本输入从第一语言翻译成第二语言的算法和/或技术。例如,响应于对翻译的请求,转录和翻译系统214可以接收语音输入,生成对应于语音输入(例如,对应于转录)的机器编码文本,并且将机器编码文本从第一语言翻译成第二语言(例如,对应于翻译)。转录和翻译系统214还被配置成提供经翻译的文本作为输出。替选地或另外,转录和翻译系统214被配置成实现或以其他方式访问用
于将翻译的文本转换成音频输出的算法和/或技术。因此,转录和翻译系统214被配置成接收语音作为输入,并且输出关键字、转录和/或翻译中的一个或更多个以用于显示和/或用于音频输出。
48.图3是示出根据某些示例的可以存储在消息服务器系统108的数据库124中的数据结构300的示意图。虽然数据库124的内容被示出为包括多个表,但是将理解的是,数据可以以其他类型的数据结构进行存储(例如,作为面向对象的数据库)。
49.数据库124包括存储在消息表306内的消息数据。对于任何特定的一条消息,该消息数据包括至少消息发送者数据、消息接收方(或接收者)数据和有效载荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储在消息表306中的消息数据中的信息的另外的细节。
50.实体表308存储实体数据,并且(例如,参考地)链接到实体图304和简档数据302。其记录保存在实体表308内的实体可以包括个人、公司实体、组织、对象、地点、事件等。不管实体类型如何,消息服务器系统108存储关于其的数据的任何实体可以是识别的实体。每个实体设置有唯一标识符,以及实体类型标识符(未示出)。
51.实体图304存储关于实体之间的关系和关联的信息。仅作为示例,这样的关系可以是基于兴趣或基于活动的职业关系(例如,在共同的公司或组织工作)、社交关系。
52.简档数据302存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置,简档数据302可以被选择性地使用并呈现给消息系统100的其他用户。在实体是个人的情况下,简档数据302包括例如用户名、电话号码、地址、设置(例如,通知和隐私设置),以及用户选择的化身表示(或这样的化身表示的集合)(如果有的话)。然后,特定用户可以将这些化身表示中的一个或更多个选择性地包括在经由消息系统100传送的消息的内容中以及在由消息客户端104向其他用户显示的地图界面上。
53.在实体是团体的情况下,除了团体名称、成员和相关团体的各种设置(例如,通知)之外,团体的简档数据302还可以类似地包括与团体相关联的一个或更多个化身表示。
54.数据库124还包括用于存储用户的相应旅行参数的旅行参数表318。虽然旅行参数表318被描绘为与简档数据302分离,但是旅行参数表318可以被包括作为简档数据302的一部分。因此,每个实体/用户可以具有与其相关联的相应旅行参数。旅行参数的示例包括但不限于:旅行时间表、运输时间表、语言、一般位置、特定地点或地标、活动、参与者(例如,参与旅行的全部或部分的朋友)和/或感兴趣的主题。
55.消息系统100可以基于在消息客户端104内提供的用户提交的内容(例如,消息线程内的内容,和/或与由消息系统100提供的旅行计划用户界面相关联的内容)来填充旅行参数表318。替选地或另外,消息系统100可以基于来自第三方应用的内容(例如,来自第三方电子邮件/文本消息应用、日历应用、航班应用、酒店应用等的内容)来填充数据库124。在一个或更多个实施方式中,用户可以选择加入和/或以其他方式授权用来自消息系统100内和/或来自第三方应用的内容填充旅行参数表318。
56.数据库124还在增强表310中存储增强数据,例如覆盖(overlay)或过滤器。增强数据与视频(视频的数据被存储在视频表314中)和图像(图像的数据被存储在图像表316中)相关联并且应用于视频和图像。
57.在一个示例中,过滤器是在向接收方用户呈现期间被显示为覆盖在图像或视频上
的覆盖。过滤器可以是各种类型的,包括当发送用户正在编写消息时从由消息客户端104呈现给发送用户的一组过滤器中用户选择的过滤器。其他类型的过滤器包括地理定位过滤器(也称为地理过滤器),其可以基于地理定位被呈现给发送用户。例如,可以基于由客户端设备102的全球定位系统(gps)单元确定的地理定位信息,由消息客户端104在用户接口内呈现特定于附近或特殊定位的地理定位过滤器。
58.另一种类型的过滤器是数据过滤器,其可以由消息客户端104基于在消息创建处理期间由客户端设备102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定定位处的当前温度、发送用户行进的当前速度、客户端设备102的电池寿命或当前时间。
59.可以被存储在图像表316内的其他增强数据包括增强现实内容项(例如,对应于应用镜头或增强现实体验)。增强现实内容项可以是可以添加至图像或视频的实时特殊效果和声音。
60.如上所述,增强数据包括增强现实内容项、覆盖、图像变换、ar图像以及涉及可以应用于图像数据(例如,视频或图像)的修改的类似术语。这包括实时修改,其在使用客户端设备102的设备传感器(例如,一个或更多个摄像装置)捕获图像时对图像进行修改并且然后在具有修改的情况下在客户端设备102的屏幕上显示图像。这还包括对所存储的内容的修改,例如对可以被修改的图库中的视频片段的修改。例如,在可以访问多个增强现实内容项的客户端设备102中,用户可以使用具有多个增强现实内容项的单个视频片段来查看不同的增强现实内容项将如何修改存储的片段。例如,通过为同一内容选择不同的增强现实内容项,可以将应用不同伪随机运动模型的多个增强现实内容项应用于该同一内容。类似地,实时视频捕获可以与示出的修改一起使用,以显示当前由客户端设备102的传感器捕获的视频图像将如何修改捕获的数据。这样的数据可以简单地显示在屏幕上而不存储在存储器中,或者由设备传感器捕获的内容可以在进行或不进行修改(或两者)的情况下被记录并存储在存储器中。在某些系统中,预览功能可以同时显示不同的增强现实内容项在显示器的不同窗口中将看起来如何。例如,这可以实现同时在显示器上查看具有不同伪随机动画的多个窗口。
61.因此,使用增强现实内容项的数据和各种系统或使用该数据修改内容的其他这样的变换系统可以涉及视频帧中对象(例如,脸、手、身体、猫、狗、表面、对象等)的检测,在这些对象离开视场、进入视场以及在视场四处移动时对这些对象的跟踪,以及在跟踪这些对象时对其进行的修改或变换。在各种实施方式中,可以使用用于实现这样的变换的不同方法。一些示例可以涉及生成一个或更多个对象的三维网格模型,以及在视频内使用模型的变换和动画纹理来实现变换。在其他示例中,可以使用对象上的点的跟踪将图像或纹理(可以是二维或三维的)放置在所跟踪的位置处。在更进一步的示例中,可以使用视频帧的神经网络分析将图像、模型或纹理放置在内容(例如,图像或视频帧)中。因此,增强现实内容项既指用于在内容中创建变换的图像、模型和纹理,也指通过对象检测、跟踪和放置实现这样的变换所需的附加建模和分析信息。
62.可以利用保存在任何种类的计算机化系统的存储器中的任何种类的视频数据(例如,视频流、视频文件等)来执行实时视频处理。例如,用户可以加载视频文件并将其保存在设备的存储器中,或者可以使用设备的传感器生成视频流。此外,可以使用计算机动画模型
来处理任何对象,例如人脸和人体的各部分、动物或非生物(例如椅子、汽车或其他对象)。
63.在一些示例中,当与要变换的内容一起选择特定修改时,要变换的元素由计算设备识别,然后如果要变换的元素存在于视频的帧中,则要变换的元素被检测和跟踪。根据修改请求修改对象的元素,从而变换视频流的帧。对于不同种类的变换,可以通过不同的方法执行对视频流的帧的变换。例如,对于主要涉及改变对象元素形式的帧变换,计算对象的每个元素的特征点(例如,使用主动形状模型(asm)或其他已知方法)。然后,针对对象的至少一个元素中的每一个生成基于特征点的网格。该网格用于跟踪视频流中的对象的元素的后续阶段。在跟踪处理中,将所提及的每个元素的网格与每个元素的位置对准。然后,在网格上生成附加点。基于修改请求针对每个元素生成第一点的第一集合,并且基于第一点的集合和修改请求针对每个元素生成第二点的集合。然后,可以通过基于第一点的集合和第二点的集合以及网格修改对象的元素,对视频流的帧进行变换。在这样的方法中,也可以通过跟踪和修改背景来使所修改对象的背景改变或变形。
64.在一些示例中,使用对象的元素改变对象的一些区域的变换可以通过计算对象的每个元素的特征点并基于计算的特征点生成网格来执行。在网格上生成点,然后基于这些点生成各种区域。然后,通过将每个元素的区域与至少一个元素中的每一个的位置对准来跟踪对象的元素,并且可以基于修改的请求来修改区域的属性,从而变换视频流的帧。根据具体修改请求,可以以不同的方式变换提及的区域的属性。这样的修改可以涉及:改变区域的颜色;从视频流的帧中移除区域的至少一些部分;将一个或更多个新对象包括在基于修改请求的区域中;以及将区域或对象的元素进行修改或变形。在各种实施方式中,可以使用这样的修改的任何组合或其他类似修改。对于某些要被动画化的模型,可以选择一些特征点作为控制点,以用于确定用于模型动画的选项的整个状态空间。
65.在使用面部检测来变换图像数据的计算机动画模型的一些示例中,使用特定面部检测算法(例如,viola-jones)在图像上检测面部。然后,将主动形状模型(asm)算法应用于图像的面部区域以检测面部特征参考点。
66.在其他示例中,可以使用其他适合面部检测的方法和算法。例如,在一些实施方式中,使用界标来定位特征,该界标表示在所考虑的大多数图像中存在的可区分点。例如,对于面部界标,可以使用左眼瞳孔的位置。如果初始界标不可识别(例如,如果人有眼罩),则可以使用次级界标。这样的界标识别过程可以用于任何这样的对象。在一些示例中,一组界标形成形状。可以使用形状中的点的坐标将形状表示为矢量。一个形状利用相似变换(允许平移、缩放和旋转)与另一个形状对准,该相似变换使形状点之间的平均欧几里德距离最小化。平均形状是对准的训练形状的均值。
67.在一些示例中,从与由全局面部检测器确定的面部的位置和大小对准的平均形状开始搜索界标。然后,这样的搜索重复以下步骤:通过每个点周围的图像纹理的模板匹配来调整形状点的定位而建议暂定形状,并且然后使暂定形状符合全局形状模型,直至发生收敛。在某些系统中,个别的模板匹配是不可靠的,并且形状模型将弱模板匹配的结果进行池化,以形成更强的整体分类器。整个搜索从粗略分辨率到精细分辨率在图像金字塔的每个级别上重复。
68.变换系统可以在客户端设备102上捕获图像或视频流,并在客户端设备102上本地执行复杂的图像操纵,同时保持适当的用户体验、计算时间和功耗。复杂的图像操纵可以包
括大小和形状变化、情绪转换(例如,将面部从皱眉变为微笑)、状态转换(例如,使被摄体变老、减少表观年龄、改变性别)、风格转换、图形元素应用,以及由已经被配置成在客户端设备102上高效执行的卷积神经网络实现的任何其他合适的图像或视频操纵。
69.在一些示例中,用于变换图像数据的计算机动画模型可以由系统使用,在该系统中,用户可以使用具有神经网络的客户端设备102来捕获用户的图像或视频流(例如,自拍),该神经网络操作为在客户端设备102上操作的消息客户端104的一部分。在消息客户端104内操作的变换系统确定图像或视频流中的面部的存在并且提供与计算机动画模型相关联的修改图标以变换图像数据,或者计算机动画模型可以被呈现为与本文中描述的接口相关联。修改图标包括以下变化,该变化可以是作为修改操作的一部分的修改图像或视频流中的用户面部的基础。一旦选择了修改图标,则变换系统发起将用户的图像转换以反映所选择的修改图标(例如,在用户上生成笑脸)的处理。一旦图像或视频流被捕获并且指定的修改被选择,则修改的图像或视频流就可以呈现在客户端设备102上显示的图形用户接口中。变换系统可以在图像或视频流的一部分上实现复杂的卷积神经网络,以生成和应用所选择的修改。也就是说,一旦选择了修改图标,用户就可以捕获图像或视频流并且实时或近乎实时地呈现修改结果。此外,当正在捕获视频流时,修改可以是持久的,并且所选择的修改图标保持被切换。机器教导的神经网络可以用于实现这样的修改。
70.呈现由变换系统执行的修改的图形用户接口可以为用户提供附加的交互选项。这样的选项可以基于用于发起特定计算机动画模型的选择和内容捕获的接口(例如,从内容创建者用户接口发起)。在各种实施方式中,修改可以在对修改图标的初始选择之后是持久的。用户可以通过轻击或以其他方式选择正由变换系统修改的面部来打开或关闭修改,并将其存储以供以后查看或浏览到成像应用的其他区域。在由变换系统修改多个面部的情况下,用户可以通过敲击或选择在图形用户接口内修改和显示的单个面部来全局打开或关闭修改。在一些实施方式中,可以通过敲击或选择图形用户接口内显示的单独面部或一系列单独面部来单独修改一组多个面部中的各个面部,或者单独切换这样的修改。
71.故事表312存储关于消息和相关联的图像、视频或音频数据的集合的数据,所述消息和相关联的图像、视频或音频数据被汇编成集合(例如,故事或图库)。特定集合的创建可以由特定用户(例如,其记录保存在实体表308中的每个用户)发起。用户可以以已经由该用户创建和发送/广播的内容集合的形式创建“个人故事”。为此,消息客户端104的用户接口可以包括用户可选择的图标,以使得发送用户能够将特定内容添加到他或她的个人故事。
72.集合还可以构成作为来自多个用户的内容集合的“实况故事”,该内容集合是手动地、自动地或者使用手动技术和自动技术的组合创建的。例如,“实况故事”可以构成来自不同位置和事件的用户提交的内容的策展流。其客户端设备启用了定位服务并且在特定时间处于共同定位事件处的用户可以例如经由消息客户端104的用户接口被呈现有将内容贡献给特定实况故事的选项。可以由消息客户端104基于用户的定位向他或她标识实况故事。最终结果是从群体角度讲述的“实况故事”。
73.另外类型的内容集合被称为“定位故事”,该“定位故事”使其客户端设备102位于特定地理定位内(例如,在学院或大学校园)的用户能够对特定集合做出贡献。在一些示例中,对定位故事的贡献可能需要二级认证来验证终端用户属于特定组织或其他实体(例如,是大学校园中的学生)。
74.如上面提到的,视频表314存储视频数据,在一个示例中,该视频数据与其记录保存在消息表306内的消息相关联。类似地,图像表316存储与其消息数据存储在实体表308中的消息相关联的图像数据。实体表308可以使来自增强表310的各种增强与存储在图像表316和视频表314中的各种图像和视频相关联。
75.图4是示出根据一些示例的消息400的结构的示意图,消息400由消息客户端104生成,以用于传送至另外的消息客户端104或消息服务器116。特定消息400的内容用于填充存储在数据库124中的消息表306,该消息表306可由消息服务器116访问。类似地,消息400的内容作为客户端设备102或应用服务器114的“传输中”(“in-transit”)或“飞行中”(“in-flight”)数据存储在存储器中。消息400被示为包括以下示例组成部分:
76.·
消息标识符402:识别消息400的唯一标识符。
77.·
消息文本有效载荷404:要由用户经由客户端设备102的用户接口生成并且被包括在消息400中的文本。
78.·
消息图像有效载荷406:由客户端设备102的摄像装置部件捕获或从客户端设备102的存储器部件检索并且被包括在消息400中的图像数据。发送或接收的消息400的图像数据可以存储在图像表316中。
79.·
消息视频有效载荷408:由摄像装置部件捕获或从客户端设备102的存储器部件检索并且被包括在消息400中的视频数据。发送或接收的消息400的视频数据可以存储在视频表314中。
80.·
消息音频有效载荷410:由麦克风捕获或从客户端设备102的存储器部件检索并且被包括在消息400中的音频数据。
81.·
消息增强数据412:表示要应用于消息400的消息图像有效载荷406、消息视频有效载荷408或消息音频有效载荷410的增强的增强数据(例如,过滤器、标贴或其他注释或增强)。发送或接收的消息400的增强数据可以存储在增强表310中。
82.·
消息持续时间参数414:参数值,其指示消息的内容(例如,消息图像有效载荷406、消息视频有效载荷408、消息音频有效载荷410)将经由消息客户端104被呈现给用户或使其对于用户可访问的以秒为单位的时间量。
83.·
消息地理定位参数416:与消息的内容有效载荷相关联的地理定位数据(例如,纬度和经度坐标)。多个消息地理定位参数416值可以被包括在有效载荷中,这些参数值中的每个参数值与关于内容中所包括的内容项(例如,消息图像有效载荷406内的特定图像或消息视频有效载荷408中的特定视频)相关联。
84.·
消息故事标识符418:标识与消息400的消息图像有效载荷406中的特定内容项相关联的一个或更多个内容集合(例如,故事表312中标识的“故事”)的标识符值。例如,可以使用标识符值将消息图像有效载荷406内的多个图像各自与多个内容集合相关联。
85.·
消息标签420:每个消息400可以用多个标签来标记,多个标签中的每个标签指示消息有效载荷中所包括的内容的主题。例如,在消息图像有效载荷406中包括的特定图像描绘动物(例如,狮子)的情况下,可以在消息标签420内包括指示相关动物的标签值。标签值可以基于用户输入手动地生成,或可以使用例如图像识别自动地生成。
86.·
消息发送者标识符422:指示在其上生成消息400并且从其发送消息400的客户端设备102的用户的标识符(例如消息系统标识符、电子邮件地址或设备标识符)。
87.·
消息接收者标识符424:指示消息400定址到的客户端设备102的用户的标识符(例如消息系统标识符、电子邮件地址或设备标识符)。
88.消息400的各个组成部分的内容(例如,值)可以是指向其内存储有内容数据值的表中的位置的指针。例如,消息图像有效载荷406中的图像值可以是指向图像表316内的位置的指针(或地址)。类似地,消息视频有效载荷408内的值可以指向存储在视频表314内的数据,存储在消息增强412内的值可以指向存储在增强表310中的数据,存储在消息故事标识符418内的值可以指向存储在故事表312中的数据,并且存储在消息发送者标识符422和消息接收者标识符424内的值可以指向存储在实体表308内的用户记录。
89.图5是示出了根据一些示例实施方式的用于与旅行相关联地提供与语音翻译相对应的增强现实内容的过程500的交互图。为了说明的目的,在此主要参照图1的消息客户端104以及图2的增强系统208以及转录和翻译系统214来描述过程500。然而,过程500的一个或更多个块(或操作)可以由一个或更多个其他部件和/或由其他合适的设备来执行。进一步出于解释的目的,过程500的块(或操作)在本文中被描述为串行或线性地发生。然而,过程500的多个块(或操作)可以并行或同时发生。另外,过程500的块(或操作)不需要以所示的顺序执行,以及/或者过程500的一个或更多个块(或操作)不需要执行和/或可以由其他操作替换。当其操作完成时,过程500可以终止。另外,过程500可以对应于方法、程序、算法等。
90.消息客户端104可以与消息服务器系统108的相应用户相关联,并且该用户可以与消息服务器系统108的用户账户相关联。如上所述,消息服务器系统108可以基于与该用户的用户账户相关联的唯一标识符(例如,消息发送系统标识符、电子邮件地址和/或设备标识符)来识别用户。另外,消息服务器系统108可以实现社交网络服务器124以及/或者结合社交网络服务器124来工作,社交网络服务器124被配置成识别特定用户与之具有关系的其他用户(例如,朋友)。
91.如本文所述,消息客户端104(例如,与消息服务器系统108结合)接收执行扫描操作的用户请求。作为响应,消息客户端104确定与请求相关联的旅行参数以及图像中描绘的对象的属性。消息客户端104基于旅行参数和/或属性选择增强现实内容项(例如,对应于增强现实体验)。增强现实内容项被配置成基于与请求相关联的语音输入来呈现增强现实内容。消息客户端104获得语音输入的转录和/或翻译,并且与图像相关联地呈现增强现实内容项,增强现实内容项包括转录或翻译中的至少一个。
92.在块502处,消息客户端104接收与对捕获图像执行扫描操作相对应的用户输入(块502)。如本文所述,执行扫描操作对应于识别捕获图像中描绘的对象。在一个或更多个实施方式中,消息客户端104激活客户端设备102的摄像装置(例如,在消息客户端104启动时)。消息客户端104允许用户请求扫描由摄像装置捕获的摄像装置馈送中的一个或更多个项。在一个或更多个实施方式中,消息客户端104检测用户的手的手指与触摸屏的区域之间的物理接触达阈值时间段(例如,对应于按压并保持手势)。例如,消息客户端104确定用户触摸了他们的手指并将其手指保持在屏幕上阈值时间(例如,两秒)。
93.在替选实施方式中,按压并保持手势可以与轮播界面(例如,如以下关于图7a至图7b所讨论的,与启动界面分开)相关联地执行。在轮播界面内,用于修改捕获图像以包括增强现实内容的增强现实内容项可以在接收用户输入之前已经被选择。关于按压并保持手
势,增强现实内容项在一些实施方式中可以包括提示用户进行输入以执行扫描操作的扫描提示。例如,扫描提示可以包括在限定预定义屏幕区域的图形边界内提示用户进行按压并保持手势的文本(例如,“按压并保持以扫描”)。
94.作为按压并保持手势的替选,消息客户端104可以接收与摄像装置馈送一起呈现的专用扫描选项(例如,扫描按钮)的用户选择。因此,响应于执行扫描操作的用户请求,消息客户端104处理捕获图像(例如,实况视频馈送)以识别图像中的对象。替选地或另外,消息客户端104处理捕获的音频输入,例如,以检测用户是否发出了与执行扫描操作的用户输入相关联的话音命令。
95.消息客户端104确定与用户输入相关联的旅行参数和/捕获图像中描绘的对象的属性(块504)。如上面关于旅行参数表318所述,与消息系统100结合的消息客户端104可以被配置成访问(例如,基于适当的用户许可)与用户的旅行有关的数据,并且相应地填充旅行参数表318。旅行参数表318可以存储与在消息客户端104内提供的用户提交的内容(例如,消息线程内的内容,和/或与消息系统100所提供的旅行计划用户界面相关联的内容)相对应的旅行参数。在另一示例中,旅行参数表318可以存储与来自第三方应用的内容(例如,来自电子邮件/文本消息、日历应用、航班应用、酒店应用的内容)相对应的旅行参数。在一个或更多个实施方式中,旅行参数指示以下中的一个或更多个:旅行时间表、运输时间表、语言、一般位置(例如,城市、州等)、特定地点或地标、活动、参与者(例如,朋友)和/或感兴趣的主题。
96.如图5所示,块506还包括确定图像中描绘的对象的属性。虽然在图5中未示出,但是可以结合对象检测系统212来执行对象的检测和/或对象的属性的确定。例如,消息客户端104可以向对象检测系统212发送用于识别所捕获图像中的对象的请求。作为响应,对象检测系统212确定捕获图像中的对象的属性。如上所述,对象检测系统212可以对应于消息系统100的子系统,并且可以在客户端侧由消息客户端104支持和/或在服务器端由应用服务器122支持。在一个或更多个实施方式中,可以在客户端侧、服务器侧和/或客户端侧和服务器侧的组合来实现对捕获图像内的对象的检测。
97.如上文进一步所述,对象检测系统212被配置成实现或以其他方式访问对象识别算法(例如,包括机器学习算法),该对象识别算法被配置成扫描捕获图像,并且检测/跟踪图像内的对象的移动。对象检测系统212还被配置成确定或以其他方式访问所识别的对象的属性。如以下关于图6a至6b、图7a至7b和图8a至8b所讨论的,对象检测系统212可以确定诸如对象的类型(例如,设备用户、除设备用户之外的个人、经由电视显示的视频)、对象的名称和/或其他一般信息(例如,物理属性、相关联的日期、相关联的企业名称、作者等)的属性。
98.如上所述,对象检测系统212可以确定与已由第三方赞助的关键字相对应的属性。例如,第三方(例如,与博物馆、场所或其他企业相关联)可以赞助或支付某些关键词(例如,壁画或其他艺术品的名称、诸如杂志的出版物的名称)以使其比其他关键词排名更高。响应于确定给定属性对应于赞助关键词,对象检测系统212可以提供该属性相对于其他属性的更高排名。
99.对象检测系统212向消息客户端104发送对象的属性以用于消息客户端104。在这样做时,对象检测系统212可以进一步提供属性的排名信息。
100.基于在块504处确定的旅行参数和/或属性,消息客户端104可以确定激活语音识别(块506)。例如,旅行参数可以指示用户正在与用户未知的语言相关联的地区(例如,另一国家)旅行。此外,图像中描绘的(例如,来自后置摄像装置的)对象的属性可以指示以这样的语言提供语音的源(例如,除了用户之外的个人,或电视)。对激活语音识别的确定还可以基于环境因素(例如,设备地理定位、时间等)。基于这些信号,消息客户端104可以确定执行相对于语音输入源的语音识别(例如,将语音翻译成用户已知的语言)。在一个或更多个实施方式中,用户的已知语言对应于与用户简档相关联地存储的主要语言(例如,在简档数据302内)。
101.在一个或更多个实施方式中,执行语音识别的确定至少部分地基于旅行参数和与在块502处的用户输入相关联地(例如,由设备麦克风)接收的话音命令。此外,所确定的属性可以指示用户发出了话音命令(例如,通过经由前置摄像装置来识别用户)。消息客户端104(例如,与实现语音识别的转录和翻译系统214结合)可以检测话音命令。例如,用户可能在执行上述按压并保持手势的同时说出了术语/短语“说”或“你怎么说”。基于旅行参数(例如,指示语言)和话音命令,消息客户端104可以确定对话音命令词之后的短语(例如,“说”之后的语音输入)执行语音识别。例如,消息客户端104可以确定将语音输入从用户已知的语言翻译为与旅行参数相关联的未知语言。以这种方式,用户可以学习在旅行时如何说所述语音输入。
102.消息客户端104向增强系统208发送对被配置用于语音识别的增强现实内容项的请求(操作508)。如上所述,增强系统208可以对应于消息系统100的子系统,并且可以在客户端侧由消息客户端104支持和/或在服务器侧由应用服务器114支持。在一个或更多个实施方式中,增强现实内容项的提供可以在客户端侧、服务器侧和/或客户端侧和服务器侧的组合实现。
103.如上文关于块502所述,可能已经在轮播界面内接收到用于执行扫描操作的用户输入,其中已经选择了增强现实内容项。替选地,用户输入可以在消息客户端104启动时(例如,在启动界面内)被接收,在这种情况下,增强现实内容项尚未被选择。
104.在尚未选择增强现实内容项的情况下,操作508处的请求可以包括用于便于对增强现实内容项的选择的一个或更多个参数(例如,旅行参数、对象的属性和/或话音命令的指示)。例如,请求可以包括用户的已知语言、与旅行相关联的语言、语音输入源(例如,用户、其他个人、电视)和/或话音命令的指示(如果适用的话)。
105.在块510处,增强系统208从多个可用增强现实内容项选择增强现实内容项,该增强现实内容项被配置用于语音识别并且基于与来自操作508的请求一起提供的参数。在一个或更多个实施方式中,增强系统208被配置成通过将参数与可用增强现实内容项中的每一个所关联的相应参数(例如,预定义术语)进行比较来搜索可用增强现实内容项的集合。
106.在一个或更多个实现方式中,包括在数据库124中的增强表310被配置成用相应属性和/或预定义术语来指定或标记每个增强现实内容项(例如,经由元数据)以搜索增强现实内容项。因此,在一个或更多个实施方式中,增强系统208利用来自请求的参数(例如,已知语言、与旅行相关联的语言、对应于语音源的对象的类型、命令的类型)来查询数据库124,并且数据库124可以提供一个或更多个所选择的增强现实内容项作为查询的结果。
107.在参数与多于一个增强现实内容项的相应属性和/或预定义词相对应的情况下,
数据库124可以被配置成提供多个增强现实内容项的指示作为查询的结果。此外,数据库124可以对多个增强现实内容项进行排名(例如,基于匹配数目和/或分配给多个参数中的参数的权重、增强现实内容项属性和/或预定义词)。数据库124可以向增强系统208提供排名的指示作为查询结果的一部分。
108.在语音输入源对应于客户端设备102的用户并且话音命令指示执行从已知语言到与旅行相关联的语言的翻译(例如,经由话音命令词“说”或“你怎么说”)的情况下,所选择的增强现实内容项可以对应于显示语音输入的视觉转录、语音输入的视觉翻译和语音输入的音频翻译。在语音输入源对应于另一个人的实况语音的示例中,所选择的增强现实内容项可以对应于提供实况语音的视觉翻译和/或实况语音的音频翻译。在语音输入源对应于显示相关联视频的电视的音频输出的示例中,所选择的增强现实内容项可以对应于提供音频输出的视觉转录、音频输出的视觉翻译和音频输出的音频翻译。因此,如果适用,增强系统208将所选择的增强现实内容项的指示与排名信息一起发送到消息客户端104(操作512)。
109.在一个或更多个实现方式中,在ar内容项已经被选择(例如,与如上所述的轮播界面相关联)的情况下,在操作508处,消息客户端104可以在发送请求时不包括上述参数。此外,块510和操作512可以简单地与维护已经选择的ar内容项的增强系统208相对应。
110.在块514处,如果所选择的增强现实内容项尚未激活,则消息客户端104激活所选择的增强现实内容项。此外,消息客户端104接收与激活的增强现实内容项相关联的语音输入(例如,经由设备麦克风)(块516)。如上所述,语音输入可以从不同的源接收,例如从用户、除用户之外的个人和/或电视(例如,或输出视频/音频的其他显示设备)接收。
111.消息客户端104结合所选择的增强现实内容项向转录和翻译系统214发送对语音输入的转录和/或翻译的请求(操作518)。如上所述,转录和翻译系统214可以对应于消息系统100的子系统,并且可以在客户端侧由消息客户端104支持和/或在服务器侧由应用服务器114支持。在一个或更多个实施方式中,经由转录和翻译系统214的语音的转录和/或翻译可以由客户端侧、服务器侧和/或客户端侧和服务器侧的组合来实现。
112.此外,转录和翻译系统214可以对应于增强系统208的子系统。因此,尽管图5的示例将操作518至522描绘为发生在消息客户端104与转录和翻译系统214之间,但是这些操作也可以(至少部分地)在消息客户端104与增强系统208之间执行。例如,增强系统208本身可以被配置成执行转录和/或翻译。替选地或另外,转录和翻译系统214可以是与增强系统208分开的系统。例如,消息客户端104和/或增强系统208可以与转录和翻译系统214通信以便获得转录和/或翻译。
113.如上所述,转录和翻译系统214被配置成执行不同类型的基于语音的功能。基于语音的功能的示例包括接收语音输入、生成对应于语音输入的机器编码文本(例如,转录)和/或将机器编码文本从第一语言翻译为第二语言(例如,翻译)。转录和翻译系统214还被配置成提供转录和/或翻译作为用于显示的文本和/或用于音频输出的语音。
114.因此,操作518处的请求可以包括语音输入、是否关于语音输入执行转录和/或翻译的指示、源/输出语言的指示、以及用于转录和/或翻译中的每一个的输出格式(例如,文本和/或音频输出)的指示。例如,是否执行转录和/或翻译的指示及其相应输出格式可以对应于如上所述选择的增强现实内容项的类型(例如,基于语音输入源、话音命令等)。
115.转录和翻译系统214生成相应输出格式的转录和/或翻译(块520)。转录和翻译系统214将所生成的转录和/或翻译发送到消息客户端104。
116.在一个或更多个实施方式中,在块520处生成并在操作522处发送的翻译可以对应于具有文本和/或音频格式的转录和/或翻译的数据结构。数据结构可由所选择的增强现实内容项使用以生成提供用于输出转录和/或翻译的增强现实内容。以此方式,增强现实内容项目可以对应于具有用于文本和/或音频输出的占位符的模板。替选地或另外,在块520处生成并在操作522处发送的转录和/或翻译可以由增强现实内容项本身生成。
117.在操作522之后,消息客户端104呈现增强现实内容项以及捕获图像,增强现实内容项包括转录和/或翻译(例如,以文本显示和/或作为音频输出)(块524)。如以下关于图6a至6b、图7a至7b和图8a至8b所讨论的,增强现实内容项可以被配置成使用包括由转录和翻译系统214提供的转录和/或翻译的增强现实内容(例如,覆盖、视觉效果等)来修改捕获图像。
118.图6a示出了根据一些示例实施方式的示例用户界面600a,其中用于基于增强现实的语音翻译的语音输入的源对应于设备用户。用户界面600a包括捕获图像602和转录604。
119.在一个或更多个实施方式中,客户端设备102的用户在消息客户端104内提供触摸输入,以执行扫描操作来识别捕获图像602中的对象(例如,来自前置摄像装置的实况视频馈送)。例如,触摸输入可以对应于在显示捕获图像602的设备屏幕的一部分内接收到的按压并保持手势,或者对诸如扫描按钮(未示出)的专用按钮的选择。
120.在一个或更多个实施方式中,在扫描操作期间,消息客户端104被配置成显示扫描图形(未示出)以指示消息客户端104正在执行扫描操作。例如,扫描图形对应于在扫描的持续时间(例如,2秒的预定持续时间)内显示的动画。
121.在扫描操作期间,客户端设备102的用户可以向消息客户端104提供语音输入(例如,通过发声或讲话)。在图6a的示例中,用户讲出短语“说出该成本是多少?”(或“用希腊语说出该成本是多少?”)。术语“说”可以对应于用于执行从用户的已知语言(例如,主要语言)到另一语言的翻译的话音命令词。另一语言可以根据旅行参数(例如,指示用户在希腊旅行)来确定和/或包括在语音输入中(例如,语音输入的“希腊语”部分)。
122.图6a的示例中的用户请求短语“该成本是多少?”从用户的已知语言(例如英语)到希腊语的翻译。响应于接收到用户输入,消息客户端104(例如,与转录和翻译系统214结合)可以提供转录整个短语以及显示生成的转录604(如图6a所示)。
123.此外,基于话音命令词(例如,术语“说”)、旅行参数(例如,指示旅行到希腊)、对象属性(例如,指示其是提供语音输入的用户)和/或环境因素(例如,设备地理定位),消息客户端104确定执行关于语音输入的语音识别。如下面关于图6b所讨论的,语音识别可以与所选择的增强现实内容项相关联地执行。此外,消息客户端104(例如,与转录和翻译系统214结合)提供对语音输入(例如,话音命令词“说”之后的短语)的翻译和/或转录。
124.图6b示出了根据一些示例实施方式的用于为由设备用户提供的话音输入提供基于增强现实的语音翻译的示例用户界面600b。用户界面600b描绘了图6a的捕获图像602。另外,用户界面600b描绘了翻译卡606、轮播界面608和所选择的ar图标610。
125.如上所述,消息客户端104可能已经确定执行关于用户提供的语音输入的语音识别。作为响应,消息客户端104可以选择(例如,与增强系统208结合)增强现实内容项来执行
这样的语音识别。
126.在这点上,轮播界面608描绘了可以关于捕获图像602应用的可选增强现实内容项。每个可用增强现实内容项由图标表示,该图标是用户可选择的以用于切换到相应的增强现实内容项。在一个或更多个实施方式中,所选择的ar图标610对应于(例如,由增强系统208)选择以执行语音识别的增强现实内容项。如图6b所示,以相对于(例如,大于)其余图标的不同方式显示所选择的ar图标610。
127.在一个或更多个实现方式中,所选择的增强现实内容项(例如,对应于所选择的ar图标610)提供语音输入的视觉转录、语音输入的视觉翻译以及语音输入的音频翻译。
128.相对于翻译卡606来描绘这些转录和/或翻译,翻译卡606由消息客户端104播放(例如,与转录和翻译系统214结合)。在一个或更多个实施方式中,翻译卡606被呈现为相对于捕获图像602的覆盖。翻译卡606的内容可以基于话音命令词(例如,术语“说”)、话音命令之后的语音输入(“该成本是多少?”)、用户的已知语言(例如,如与简档数据302相关联地存储的),和/或输出语言(例如,基于旅行参数和/或“用希腊语”(在被包括作为语音输入的一部分的情况下))。此外,翻译卡606可以包括用于翻译的音频回放的接口元件。
129.在一个或更多个实施方式中,响应于用户对所选择的ar图标610的选择,消息客户端104提供用于生成包括屏幕内容的图像(例如,响应于所选择的ar图标610的按压/敲击手势)和/或视频(例如,响应于所选择的ar图标610的按压并保持手势)的媒体内容项目,例如以便发送给朋友、包括在故事中等。
130.图7a示出了根据一些示例实施方式的示例用户界面700a,其中用于基于增强现实的语音翻译的语音输入的源对应于设备用户之外的个体。用户界面700a包括捕获图像702、轮播界面706和选择的ar图标708。
131.在一个或更多个实施方式中,客户端设备102的用户在消息客户端104内提供触摸输入704,以执行扫描操作来识别捕获图像702中的对象(例如,来自后置摄像装置的实况视频馈送)。例如,触摸输入704可以对应于在显示捕获图像702的设备屏幕的一部分内接收到的按压并保持手势。
132.在一个或更多个实施方式中,在扫描操作期间,消息客户端104被配置成显示扫描图形(未示出)以指示消息客户端104正在执行扫描操作。例如,扫描图形对应于在扫描的持续时间(例如,2秒的预定持续时间)内显示的动画。
133.在扫描操作期间,消息客户端104(例如,与对象检测系统212结合)可以在捕获图像702中检测不同于设备用户的个体。个体可以提供实况语音,该实况语音由设备麦克风捕获为语音输入。此外,消息客户端104可以确定指示实况语音的语言的旅行参数(例如,用户正在旅行的区域)。
134.基于语音输入、对象属性、旅行参数和/或环境因素(例如,装置地理定位),消息客户端104确定执行关于语音输入的语音识别。如下面关于图7b所讨论的,可以与所选择的增强现实内容项相关联地执行语音识别。此外,消息客户端104(例如,与转录和翻译系统214结合)提供翻译和/或转录语音输入。
135.类似于图6a的轮播界面608,图7b的轮播界面706允许用户循环通过和/或选择不同的增强现实内容项以相对于捕获图像702应用/显示。另外,与活动增强现实内容项相对应的图标(例如,所选择的ar图标708)是用户可选择的,以生成包括图像(例如,响应于按
压/敲击手势)和/或视频(例如,响应于按压并保持手势)的媒体内容项。
136.图7b示出了根据一些示例实施方式的用于为由不同于设备用户的个体提供的语音输入提供基于增强现实的语音翻译的示例用户界面700b。用户界面700b描绘了图7a的捕获图像702和触摸输入704。虽然在图7b中未示出,但是用户界面700b可以继续描绘图7a的轮播界面706和/或所选择的ar图标708。另外,用户界面700b描绘转录712和翻译714。
137.如上所述,消息客户端104可能已经确定执行关于由在捕获图像702中描述的个人提供的语音输入的语音识别。作为响应,消息客户端104可以选择(例如,与增强系统208结合)增强现实内容项来执行这样的语音识别。在一个或更多个实现方式中,所选择的增强现实内容项(例如,对应于所选择的ar图标708)提供了实况语音的视觉转录、实况语音的视觉翻译和/或实况语音的音频翻译。
138.因此,消息客户端104(例如,与转录和翻译系统214结合)与所选择的增强现实内容项相关联地显示转录712和翻译714。转录712和翻译714可以被呈现为相对于捕获图像702的覆盖。转录712可以基于语音输入(例如,由个体提供)和/或输入语言(例如,基于旅行参数和/或用于从语音识别语言的已知处理技术)。此外,翻译714可以基于将语音输入翻译成用户的已知语言(例如,如与简档数据302相关联地存储的)。
139.图8a示出了根据一些示例实施方式的用于为由电视提供的语音输入提供基于增强现实的语音翻译的示例用户界面800a。用户界面800a包括捕获图像802、翻译工具804和翻译806。
140.在一个或更多个实施方式中,客户端设备102的用户在消息客户端104内提供触摸输入,以执行扫描操作来识别捕获图像802中的对象(例如,来自后置摄像装置的实况视频馈送)。例如,触摸输入704可以对应于在显示捕获图像802的设备屏幕的一部分内接收到的按压并保持手势。
141.在一个或更多个实施方式中,在扫描操作期间,消息客户端104被配置成显示扫描图形(未示出)以指示消息客户端104正在执行扫描操作。例如,扫描图形对应于在扫描的持续时间(例如,2秒的预定持续时间)内显示的动画。
142.在扫描操作期间,消息客户端104(例如,与对象检测系统212结合)可以检测指示来自电视或其他显示设备的视频和音频输出的对象属性。来自电视的音频输出可以对应于由消息客户端104接收的语音输入。此外,消息客户端104可以确定旅行参数(例如,用户正在旅行的区域),该旅行参数指示音频输出的语言。
143.基于语音输入、对象属性、旅行参数和/或环境因素(例如,设备地理定位),消息客户端104确定执行关于语音输入的语音识别。基于该确定,消息客户端104可以选择(例如,与增强系统208结合)增强现实内容项来执行这样的语音识别。在一个或更多个实施方式中,所选择的增强现实内容项提供音频输出的视觉转录、音频输出的视觉翻译或音频输出的音频翻译中的至少一个。
144.就这一点而言,用户界面800a包括翻译工具804,用于激活/去激活文本转录(例如,对应于与旅行相关联的语言的电视的音频输出)和/或文本翻译(例如,对应于用户的已知语言)的显示。翻译工具804还可以提供激活/去激活翻译的音频输出。在图8a的示例中,用户界面800a提供翻译806的显示,并且可以提供翻译的对应音频输出。
145.图8b示出了根据一些示例实施方式的用于为由电视提供的语音输入提供基于增
强现实的话音翻译的另一示例用户界面800b。用户界面800b描绘图8a的捕获图像802、翻译工具804和翻译806。在图8b的示例中,用户界面800b还提供与电视的音频输出相对应的转录808的显示(例如,基于用户关于翻译工具804的选择)。
146.图9是示出根据一些示例实施方式的用于与旅行相关联地提供与语音翻译相对应的增强现实内容的过程900的流程图。为了说明的目的,在此主要参照图1的消息客户端104以及图2的增强系统208与转录和翻译系统214来描述过程900。然而,过程900的一个或更多个块(或操作)可以由一个或更多个其他部件和/或由其他合适的设备来执行。进一步出于解释的目的,过程900的块(或操作)在本文中被描述为串行或线性地发生。然而,过程900的多个块(或操作)可以并行或同时发生。另外,过程900的块(或操作)不需要以所示的顺序执行,和/或过程900的一个或更多个块(或操作)不需要执行和/或可以由其他操作替换。当其操作完成时,过程900可以终止。另外,过程900可以对应于方法、程序、算法等。
147.消息客户端104接收与由设备摄像装置捕获的图像相关联地执行扫描操作的请求(块902)。图像可以对应于设备的摄像装置的实况馈送。
148.消息客户端104确定与该请求相关联的旅行参数和图像中描绘的对象的属性(块904)。旅行参数可以指示与用户的旅行相关联的旅行时间表、运输时间表、语言、一般位置、特定地点或地标、活动、参与者列表、或感兴趣的主题中的至少一个。
149.消息客户端104基于旅行参数或属性中的至少一个从多个增强现实内容项中选择增强现实内容项,增强现实内容项被配置成基于与请求相关联的语音输入来呈现增强现实内容(块906)。选择增强现实内容项还可以基于设备的地理定位。
150.消息客户端104接收语音输入(块908)。消息客户端104获得语音输入的转录或翻译中的至少一个(块910)。消息客户端104与图像相关联地呈现增强现实内容项,增强现实内容项包括转录或翻译中的至少一个(块912)。
151.例如,属性可以指示对象对应于图像中不同于用户的个体,该个体提供对应于实况语音的语音输入。在这样的情况下,可以选择增强现实内容项以便提供实况语音的视觉翻译或实况语音的音频翻译中的至少一个。
152.在另一示例中,属性可以指示对象对应于在第二设备上显示的视频,该视频与对应于语音输入的音频输出一起显示。在这种情况下,可以选择增强现实内容项以便提供音频输出的视觉转录、音频输出的视觉翻译或音频输出的音频翻译中的至少一个。
153.在另一示例中,消息客户端104可以检测用于翻译语音输入的话音命令,该话音命令和语音输入由用户与请求相关联地提供,并且属性可以指示对象对应于用户。在这种情况下,可以选择增强现实内容项以便提供语音输入的视觉转录、语音输入的视觉翻译和语音输入的音频翻译。
154.图10是示出访问限制过程1000的示意图,根据该访问限制过程,对内容(例如,短暂消息1010和相关联的数据的多媒体有效载荷)或内容集合(例如,短暂消息组1006)的访问可以是时间受限的(例如,使得是短暂的)。
155.短暂消息1010被示为与消息持续时间参数1014相关联,消息持续时间参数1014的值确定消息客户端104将向短暂消息1010的接收用户显示短暂消息1010的时间量。在一个示例中,取决于发送用户使用消息持续时间参数1014指定的时间量,接收用户可以查看短暂消息1010达到最多10秒。
156.消息持续时间参数1014和消息接收者标识符424被示出为消息定时器1012的输入,消息定时器1012负责确定向由消息接收者标识符424标识的特定接收用户示出短暂消息1010的时间量。特别地,仅在由消息持续时间参数1014的值确定的时间段内向相关接收用户示出短暂消息1010。消息定时器1012被示出为向更一般化的短暂定时器系统202提供输出,该短暂定时器系统202负责向接收用户显示内容(例如,短暂消息1010)的总体定时。
157.图10中示出的短暂消息1010被包括在短暂消息组1006(例如,个人故事或事件故事中的消息的集合)内。短暂消息组1006具有相关联的组持续时间参数1004,组持续时间参数1004的值确定短暂消息组1006被呈现并可由消息系统100的用户访问的持续时间。例如,组持续时间参数1004可以是音乐会的持续时间,其中,短暂消息组1006是涉及该音乐会的内容的集合。替选地,当执行短暂消息组1006的设置和创建时,用户(拥有用户或策展者用户)可以指定组持续时间参数1004的值。
158.另外,短暂消息组1006内的每个短暂消息1010具有相关联的组参与参数1002,组参与参数1002的值确定在短暂消息组1006的上下文内将可访问短暂消息1010的持续时间。因此,在短暂消息组1006本身根据组持续时间参数1004到期之前,特定的短暂消息组1006可以“到期”并且在短暂消息组1006的上下文中变得不可访问。组持续时间参数1004、组参与参数1002和消息接收者标识符424各自向组定时器1008提供输入,组定时器1008可操作地首先确定短暂消息组1006的特定短暂消息1010是否将被显示给特定接收用户,并且如果是,则确定显示多长时间。注意,由于消息接收者标识符424,短暂消息组1006也知道特定接收用户的身份。
159.因此,组定时器1008可操作地控制相关联的短暂消息组1006以及包括在短暂消息组1006中的单独的短暂消息1010的总使用期限。在一个示例中,短暂消息组1006内的每个短暂消息1010在由组持续时间参数1004指定的时间段内保持可查看和可访问。在另一示例中,在短暂消息组1006的上下文内,某个短暂消息1010可以基于组参与参数1002而到期。注意,即使在短暂消息组1006的上下文内,消息持续时间参数1014也仍然可以确定向接收用户显示特定短暂消息1010的持续时间。因此,消息持续时间参数1014确定向接收用户显示特定短暂消息1010的持续时间,而不管接收用户是在短暂消息组1006的上下文之内还是之外查看该短暂消息1010。
160.短暂定时器系统202还可以基于确定特定的短暂消息1010已经超过相关联的组参与参数1002而从短暂消息组1006中可操作地移除该特定的短暂消息1010。例如,当发送用户已经建立了从发布起24小时的组参与参数1002时,短暂定时器系统202将在指定的二十四小时之后从短暂消息组1006中移除相关的短暂消息1010。短暂定时器系统202还进行操作以当针对短暂消息组1006内的每个短暂消息1010的组参与参数1002已到期时,或者当短暂消息组1006本身根据组持续时间参数1004已到期时,移除短暂消息组1006。
161.在某些使用情况下,特定短暂消息组1006的创建者可以指定无期限的组持续时间参数1004。在这种情况下,针对短暂消息组1006内最后剩余的短暂消息1010的组参与参数1002的到期将确定短暂消息组1006本身何时到期。在这种情况下,添加至短暂消息组1006的具有新的组参与参数1002的新的短暂消息1010有效地将短暂消息组1006的寿命延长到等于组参与参数1002的值。
162.响应于短暂定时器系统202确定短暂消息组1006已经到期(例如,不再是可访问
的),短暂定时器系统202与消息系统100(并且例如特别是消息客户端104)通信,以使得与相关短暂消息组1006相关联的标记(例如,图标)不再显示在消息客户端104的用户接口内。类似地,当短暂定时器系统202确定针对特定短暂消息1010的消息持续时间参数1014已到期时,短暂定时器系统202使消息客户端104不再显示与短暂消息1010相关联的标记(例如,图标或文本标识)。
163.图11是机器1100的图解表示,在该机器1100内可以执行用于使机器1100执行本文所讨论的方法中的任何一个或更多个方法的指令1106(例如,软件、程序、应用、小程序、app或其他可执行代码)。例如,指令1106可以使机器1100执行本文所描述的方法中的任何一种或更多种。指令1106将通用的未经编程的机器1100变换成特定机器1100,该特定机器1100被编程为以所描述的方式执行所描述和所示出的功能。机器1100可以作为独立设备操作或者可以耦接(例如,联网)到其他机器。在网络部署中,机器1100可以在服务器-客户端网络环境中以服务器机器或客户端机器的身份操作,或者在对等(或分布式)网络环境中作为对等机器操作。机器1100可以包括但不限于:服务器计算机、客户端计算机、个人计算机(pc)、平板计算机、膝上型计算机、上网本、机顶盒(stb)、个人数字助理(pda)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能电器)、其他智能设备、web装置、网络路由器、网络交换机、网络桥接器或者能够顺序地或以其他方式执行指定要由机器1100采取的动作的指令1106的任何机器。此外,虽然仅示出了单个机器1100,但是术语“机器”还应被认为包括单独地或联合地执行指令1100以执行本文中讨论的任何一种或更多种方法的机器的集合。例如,机器1100可以包括客户端设备102或者形成消息服务器系统108的一部分的多个服务器设备中的任何一个。在一些示例中,机器1100还可以包括客户端系统和服务器系统两者,其中在服务器侧执行特定方法或算法的某些操作,并且在客户端侧执行特定方法或算法的某些操作。
164.机器1100可以包括可以被配置成经由总线1120彼此通信的处理器1102、存储器1110和输入/输出(i/o)部件1122。在示例中,处理器1102(例如,中央处理单元(cpu)、精简指令集计算(risc)处理器、复杂指令集计算(cisc)处理器、图形处理单元(gpu)、数字信号处理器(dsp)、专用集成电路(asic)、射频集成电路(rfic)、另外的处理器或其任何合适的组合)可以包括例如执行指令1106的处理器1104和处理器1108。术语“处理器”旨在包括多核处理器,该多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图11示出了多个处理器1102,但是机器1100可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器或其任何组合。
165.存储器1110包括主存储器1112、静态存储器1114和存储单元1116,二者可由处理器1102经由总线1120访问。主存储器1110、静态存储器1114和存储单元1116存储实现本文中所描述的方法或功能中的任何一个或更多个方法或功能的指令1106。指令1106还可以在其被机器1100执行期间完全地或部分地驻留在主存储器1112内、在静态存储器1114内、在存储单元1116内的机器可读介质1118内、在处理器1102中的至少一个处理器内(例如,在处理器的高速缓存存储器内)、或其任何合适的组合。
166.i/o部件1122可以包括接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量等的各种各样的部件。包括在特定机器中的具体i/o部件1122将取决于机器的类型。例
如,便携式机器诸如移动电话可以包括触摸输入设备或其他这样的输入机构,而无头服务器机器将不太可能包括这样的触摸输入设备。应当理解的是,i/o部件1122可以包括图11中未示出的许多其他部件。在各种示例中,i/o部件1122可以包括用户输出部件1124和用户输入部件1126。用户输出部件1124可以包括视觉部件(例如,诸如等离子显示面板(pdp)、发光二极管(led)显示器、液晶显示器(lcd)、投影仪或阴极射线管(crt)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号生成器等。用户输入部件1126可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,物理按钮、提供触摸或触摸手势的位置和力的触摸屏、或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
167.在其他示例中,i/o部件1122可以包括生物识别部件1128、运动部件1130、环境部件1132、或位置部件1134以及各种其他部件。例如,生物识别部件1128包括用于检测表达(例如,手表达、面部表情、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件1130包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
168.环境部件1132包括例如:一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,为了安全而检测危险气体的浓度或者测量大气中的污染物的气体检测传感器)、或者可以提供与周围物理环境对应的指示、测量或信号的其他部件。
169.关于摄像装置,客户端设备102可以具有摄像装置系统,该摄像装置系统包括例如客户端设备102的前表面上的前置摄像装置和客户端设备102的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端设备102的用户的静止图像和视频(例如,“自拍”),然后可以用上述增强数据(例如,过滤器)对该静止图像和视频进行增强。例如,后置摄像装置可以用于以更传统的摄像装置模式捕获静止图像和视频,这些图像类似地使用增强数据进行增强。除了前置和后置摄像装置之外,客户端设备102还可以包括用于捕获360
°
照片和视频的360
°
摄像装置。
170.此外,客户端设备102的摄像装置系统可以包括双后置摄像装置(例如,主摄像装置以及深度感测摄像装置),或者甚至在客户端设备102的前后侧上包括三重、四重或五重后置摄像装置配置。例如,这些多摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。
171.位置部件1134包括定位传感器部件(例如,gps接收器部件)、海拔传感器部件(例如,检测可以得到海拔的气压的高度计或气压计)、取向传感器部件(例如,磁力计)等。
172.可以使用各种各样的技术来实现通信。i/o部件1122还包括通信部件1136,通信部件1136可操作以经由相应的耦接或连接将机器1100耦接至网络1140或设备1138。例如,通信部件1136可以包括网络接口部件或另一合适的设备以与网络1140对接。在另外的示例中,通信部件1136可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(nfc)部
件、部件(例如,低功耗)、部件以及经由其他模态提供通信的其他通信部件。设备1138可以是另一机器或各种外围设备中的任何外围设备(例如,经由usb耦接的外围设备)。
173.此外,通信部件1136可以检测标识符或包括可操作以检测标识符的部件。例如,通信部件1136可以包括射频识别(rfid)标签读取器部件、nfc智能标签检测部件、光学读取器部件(例如,用于检测诸如通用产品代码(upc)条形码的一维条形码、诸如快速反应(qr)码、aztec码、数据矩阵、数据符号(dataglyph)、最大码(maxicode)、pdf417、超码(ultra code)、ucc rss-2d条形码的多维条形码和其他光学码的光学传感器)或声学检测部件(例如,用于识别标记的音频信号的麦克风)。另外,可以经由通信部件1136得出各种信息,例如经由因特网协议(ip)地理定位得出的定位、经由信号三角测量得出的定位、经由检测可以指示特定定位的nfc信标信号得出的定位等。
174.各种存储器(例如,主存储器1112、静态存储器1114以及处理器1102的存储器)以及存储单元1116可以存储由本文中描述的方法或功能中的任何一个或更多个实施或使用的一组或更多组指令和数据结构(例如,软件)。这些指令(例如,指令1106)在由处理器1102执行时使各种操作实现所公开的示例。
175.可以经由网络接口设备(例如,通信部件1136中包括的网络接口部件),使用传输介质并且使用若干公知的传输协议中的任何一种传输协议(例如,超文本传输协议(http)),通过网络1140来发送或接收指令1106。类似地,可以使用传输介质经由与设备1138的耦接(例如,对等耦接)来发送或接收指令1106。
176.图12是示出软件架构1202的框图1200,该软件架构1202可以安装在本文所描述的任何一个或更多个设备上。软件架构1202由硬件例如包括处理器1248、存储器1250和i/o部件1252的机器1208支持。在该示例中,可以将软件架构1202概念化为层的堆栈,在该层的堆栈中,每个层提供特定的功能。软件架构1202包括如下层,例如操作系统1216、库1214、框架1212和应用1210。在操作上,应用1210通过软件堆栈来激活api调用1204并响应于api调用1204来接收消息1206。
177.操作系统1216管理硬件资源并提供公共服务。操作系统1216包括例如核1242、服务1244和驱动器1246。核1242充当硬件层与其他软件层之间的抽象层。例如,核1242提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置以及其他功能。服务1244可以为其他软件层提供其他公共服务。驱动器1246负责控制底层硬件或与底层硬件对接。例如,驱动器1246可以包括显示驱动器、摄像装置驱动器、或低能量驱动器、闪存驱动器、串行通信驱动器(例如,usb驱动器)、驱动器、音频驱动器、电力管理驱动器等。
178.库1214提供由应用1210使用的公共低级基础设施。库1214可以包括系统库1236(例如,c标准库),系统库1236提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。另外,库1214可以包括api库1238,例如媒体库(例如,用于支持各种媒体格式的呈现和操作的库,所述各种媒体格式例如运动图像专家组-4(mpeg4)、高级视频编码(h.264或avc)、运动图像专家组层-3(mp3)、高级音频编码(aac)、自适应多速率(amr)音频编解码器、联合图像专家组(jpeg或jpg)或便携式网络图形(png))、图形库(例如,用于在显示器上的
图形内容中以二维(2d)和三维(3d)进行呈现的opengl框架)、数据库库(例如,提供各种关系数据库功能的sqlite)、web库(例如,提供web浏览功能的webkit)等。库1214还可以包括多种其他库1240,以向应用1210提供许多其他api。
179.框架1212提供由应用1210使用的公共高级基础设施。例如,框架1212提供各种图形用户接口(gui)功能、高级资源管理和高级定位服务。框架1212可以提供可由应用1210使用的广泛的其他api,其中的一些api可以专用于特定的操作系统或平台。
180.在示例中,应用1210可以包括家庭应用1218、联系人应用1224、浏览器应用1228、书籍阅读器应用1232、定位应用1220、媒体应用1226、消息应用1230、游戏应用1234和诸如第三方应用1222的种类繁多的其他应用。应用1210是执行程序中定义的功能的程序。可以使用各种编程语言来创建以各种方式构造的应用1210中的一个或更多个,所述编程语言例如面向对象的编程语言(例如,objective-c、java或c++)或过程编程语言(例如,c或汇编语言)。在特定示例中,第三方应用1222(例如,由特定平台的供应商以外的实体使用android
tm
或ios
tm
软件开发工具包(sdk)开发的应用)可以是在诸如ios
tm
、android
tm
、phone的移动操作系统或其他移动操作系统上运行的移动软件。在该示例中,第三方应用1222可以激活由操作系统1216提供的api调用1204以有助于本文中描述的功能。
[0181]“载波信号”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或其他无形介质以便于这些指令的通信。可以经由网络接口设备使用传输介质在网络上发送或接收指令。
[0182]“客户端设备”是指与通信网络对接以从一个或更多个服务器系统或其他客户端设备获得资源的任何机器。客户端设备可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(pda)、智能电话、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信设备。
[0183]“通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(vpn)、局域网(lan)、无线lan(wlan)、广域网(wan)、无线wan(wwan)、城域网(man)、因特网、因特网的一部分、公共交换电话网(pstn)的一部分、普通老式电话服务(pots)网络、蜂窝电话网络、无线网络、网络、其他类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(cdma)连接、全局移动通信系统(gsm)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,例如单载波无线电传输技术(1xrtt)、演进数据优化(evdo)技术、通用分组无线电服务(gprs)技术、增强数据速率的gsm演进(edge)技术、包括3g的第三代合作伙伴计划(3gpp)、第四代无线(4g)网络、通用移动电信系统(umts)、高速分组接入(hspa)、全球微波接入互操作性(wimax)、长期演进(lte)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
[0184]“部件”是指具有以下边界的设备、物理实体或逻辑,该边界由功能或子例程调用、分支点、api或者对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由它们的接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的封装功能硬件单元以及通常执行相关功能的特定功能的程序的一部分。部件可以构成软
件部件(例如,在机器可读介质上实施的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例实施方式中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置成进行操作以执行本文中描述的某些操作的硬件部件。也可以机械地、电子地或其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是例如现场可编程门阵列(fpga)或专用集成电路(asic)的专用处理器。硬件部件还可以包括通过软件被临时配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件部件成为特定的机器(或机器的特定部件),该特定的机器(或机器的特定部件)被唯一地定制成执行配置的功能并且不再是通用处理器。将理解,可以出于成本和时间考虑来决定机械地、在专用且永久配置的电路中还是在临时配置(例如,由软件配置)的电路中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成涵盖有形实体,即被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或者执行本文中所描述的某些操作的实体。考虑硬件部件被临时配置(例如,被编程)的实施方式,无需在任一时刻对硬件部件中的每一个进行配置或实例化。例如,在硬件部件包括通过软件配置而成为专用处理器的通用处理器的情况下,通用处理器可以在不同时间处被配置成分别不同的专用处理器(例如,包括不同的硬件部件)。软件相应地配置特定处理器或处理器,以例如在一个时刻处构成特定硬件部件并且在不同的时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息并且从其他硬件部件接收信息。因此,所描述的硬件部件可以被认为是通信上耦接的。在同时存在多个硬件部件的情况下,可以通过在两个或更多个硬件部件之间或之中(例如,通过适当的电路和总线)的信号传输来实现通信。在其中多个硬件部件在不同时间处被配置或被实例化的实施方式中,可以例如通过将信息存储在多个硬件部件可以访问的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在通信上耦接的存储器设备中。然后,另外的硬件部件可以在随后的时间处访问存储器设备,以检索和处理所存储的输出。硬件部件还可以发起与输入设备或输出设备的通信,并且可以对资源进行操作(例如,信息的集合)。在本文中描述的示例方法的各种操作可以至少部分地由临时地配置(例如,由软件)或永久地配置成执行相关操作的一个或更多个处理器来执行。无论是临时配置还是永久配置,这样的处理器可以构成进行操作以执行本文描述的一个或更多个操作或功能的处理器实现的部件。如本文中使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,本文中描述的方法可以至少部分地由处理器实现,其中特定的一个或更多个处理器是硬件的示例。例如,方法的至少一些操作可以由一个或更多个处理器或处理器实现的部件来执行。此外,所述一个或更多个处理器还可以操作成支持“云计算”环境中的相关操作的执行或者操作为“软件即服务”(saas)。例如,操作中的至少一些操作可以由计算机组(作为包括处理器的机器的示例)执行,其中,这些操作能够经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,api)进行访问。某些操作的执行可以分布在处理器之间,不仅仅驻留在单个机器内,而是可以被部署在多个机器上。在一些示例实施方式中,处理器或处理器实现的
部件可以位于单个地理定位中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例实施方式中,处理器或处理器实现的部件可以跨多个地理定位分布。
[0185]“计算机可读存储介质”是指机器存储介质和传输介质两者。因此,这些术语包括存储设备/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“设备可读介质”意指相同的事物,并且可以在本公开内容中可互换地使用。
[0186]“短暂消息”是指在时间有限的持续时间内可访问的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送者设置。替选地,访问时间可以是默认设置或者由接收者指定的设置。不管设置技术如何,消息都是暂态的。
[0187]“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储设备和介质(例如,集中式或分布式数据库,以及相关联的高速缓存和服务器)。因此,该术语应被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和设备存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器设备,例如可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、fpga和闪存设备;磁盘,诸如内部硬盘和可移动盘;磁光盘;以及cd-rom和dvd-rom盘。术语“机器存储介质”、“设备存储介质”、“计算机存储介质”意指相同的事物,并且在本公开内容中可以互换地使用。术语“机器存储介质”、“计算机存储介质”和“设备存储介质”明确地排除了载波、调制数据信号和其他这样的介质,所述载波、调制数据信号和其他这样的介质中的至少一些被涵盖在术语“信号介质”中。
[0188]“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
[0189]“信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质,并且包括数字或模拟通信信号或其他无形介质以有助于软件或数据的通信。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指使其特性中的一个或更多个特性以将信息编码在信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”意指相同的事物并且可以在本公开内容中互换使用。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1