基于内容中包括的项目图像来更新在线系统用户的简档的制作方法

文档序号:27681935发布日期:2021-12-01 00:00阅读:86来源:国知局
基于内容中包括的项目图像来更新在线系统用户的简档的制作方法

1.本公开总体上涉及在线系统,并且更具体地涉及基于在从用户接收的内容和/或用户与之交互的内容中包括的项目的图像来更新在线系统用户的简档(profile)以包括对项目的亲和力(affinity)。
2.背景
3.在线系统允许其用户与其他在线系统用户关连(connect)和通信。用户于在线系统中创建简档,该简档与他们的身份相关联并且包括关于用户的信息(例如兴趣和人口统计信息)。用户可以是个人或实体(例如公司或慈善机构)。由于在线系统的流行和在线系统中维护的大量用户特定信息,在线系统提供了一个理想的论坛,允许用户通过创建内容项(content item)来共享内容,以呈现给其他在线系统用户。例如,用户可以通过创建包括照片或视频的内容项来共享他们上传的照片或视频,这些内容项被呈现给在线系统中他们所关连的其他用户。
4.照惯例,在线系统基于用户对可以与内容相关联的各种项目(item)(例如产品)或主题(例如,产品或服务的特定或一般类别、地理位置、爱好、运动、音乐、电影等)的亲和力来选择内容用于呈现给他们的用户。用户对项目或主题的亲和力可以由用户与在线系统明确地共享(例如,当建立要在在线系统中维护的用户简档时共享)。如果描述项目或主题的信息被包括在从用户接收的内容中和/或如果该信息被包括在用户与之交互的内容中(例如在标签(tag)中、在标题中等),则用户对项目或主题的亲和力也可以由在线系统推断。例如,假设从在线系统用户接收的内容项包括夹克的图像,其中内容项还包括描述夹克的标签(例如,夹克的样式和品牌(brand))。在该示例中,内容项被呈现给的在线系统的附加用户可以与内容项交互(例如,通过表达对内容项的偏好、评论内容项、保存内容项、共享内容项等)。在上述示例中,基于标签,在线系统可以推断出内容项被接收自的用户和与内容项交互的用户具有对夹克的样式和/或品牌的亲和力,并且随后可以选择与夹克的样式和/或品牌相关联的内容项以用于呈现给用户。
5.然而,如果从用户接收的内容和/或用户与之交互的内容不包括描述与内容相关联的项目或主题的信息,则在线系统可能无法推断出它们的用户可能有亲和力的项目或主题。在上述示例中,如果内容项不包括描述夹克的标签或任何其他信息,则在线系统不能够推断用户对夹克的样式和/或品牌的亲和力,且因此将不能够识别与夹克的样式和/或品牌相关联的内容项以用于呈现给用户。因此,在线系统可能无法向在线系统用户呈现相关内容,这可能使用户体验降级。
6.概述
7.在线系统照惯例基于用户对可能与内容相关联的各种项目或主题的亲和力来选择内容用于呈现给其用户。基于描述在从在线系统用户接收的内容和/或在线系统用户与之交互的内容中包括的项目或主题的信息,在线系统可以推断其用户对项目或主题的亲和力,并选择与这些项目或主题相关联的内容用于呈现给用户。然而,如果从用户接收的内容不包括与内容相关联的项目或主题的描述,在线系统不能够识别它们的用户可能有亲和力
的项目或主题,因此无法向它们的用户呈现相关内容。
8.为了更准确地选择用户可能有亲和力的内容项以用于呈现给在线系统用户,在线系统基于在从用户接收的内容中包括的项目的图像和/或基于在用户与之交互的内容中包括的项目的图像来更新在线系统用户的简档以包括用户对项目的亲和力。更具体地,在线系统从在线系统的内容提供用户接收包括图像的内容项,其中内容项将被呈现给在线系统的一个或更多个观看用户。在线系统还可以从在线系统的观看用户接收与内容项的交互。在线系统然后访问机器学习模型,该机器学习模型基于与存在于在线系统上的实体相关联的一个或更多个项目的一组图像以及每个图像的一组属性来被训练。在线系统应用经训练的机器学习模型来预测内容项包括与实体相关联的项目的图像的概率,其中该概率基于被包括在内容项中的图像的一个或更多个属性被预测。在线系统然后基于所预测的概率来更新对象用户(subject user)(即,内容提供用户和/或观看用户)的简档以包括对象用户对项目的亲和力。当确定向对象用户呈现内容的机会时,在线系统至少部分地基于对象用户的简档来选择一个或更多个内容项用于呈现给对象用户,并且发送所选择的内容项用于呈现给对象用户。
9.附图简述
10.图1是根据实施例的在线系统在其中操作的系统环境的框图。
11.图2是根据实施例的在线系统的框图。
12.图3是根据实施例的用于基于在从用户接收的内容和/或用户与之交互的内容中包括的项目的图像来更新在线系统用户的简档以包括用户对项目的亲和力的方法的流程图。
13.图4是根据实施例的主题的分级结构(hierarchy)的示例。
14.图5是根据实施例的用户产品嵌入空间(embedding space)的示例。
15.附图仅为了说明的目的而描绘各种实施例。本领域中的技术人员从下面的讨论中将容易认识到,本文示出的结构和方法的替代实施例可以被采用而不偏离本文所述的原理。
16.详细描述
17.系统架构
18.图1是在线系统140的系统环境100的框图。图1所示的系统环境100包括一个或更多个客户端设备110、网络120、一个或更多个第三方系统130和在线系统140。在替代配置中,系统环境100中可以包括不同和/或附加的部件。
19.客户端设备110是能够接收用户输入以及经由网络120发送和/或接收数据的一个或更多个计算设备。在一个实施例中,客户端设备110是常规的计算机系统,诸如台式计算机或膝上型计算机。替代地,客户端设备110可以是具有计算机功能的设备,例如个人数字助理(pda)、移动电话、智能手机或其他合适的设备。客户端设备110被配置成经由网络120进行通信。在一个实施例中,客户端设备110执行允许客户端设备110的用户与在线系统140交互的应用。例如,客户端设备110执行浏览器应用,以使得客户端设备110和在线系统140之间能够经由网络120进行交互。在另一实施例中,客户端设备110通过运行在客户端设备110的本机(native)操作系统(例如或android
tm
)上的应用编程接口(api)来与在线系统140交互。
20.客户端设备110被配置成使用有线和/或无线通信系统经由网络120进行通信,网络120可以包括局域网和/或广域网的任何组合。在一个实施例中,网络120使用标准通信技术和/或协议。例如,网络120包括使用诸如以太网、802.11、全球微波接入互操作性(wimax)、3g、4g、码分多址(cdma)、数字用户线路(dsl)等技术的通信链路。用于经由网络120进行通信的网络协议的示例包括多协议标签交换(mpls)、传输控制协议/互联网协议(tcp/ip)、超文本传输协议(http)、简单邮件传输协议(smtp)和文件传输协议(ftp)。可以使用任何合适的格式(例如超文本标记语言(html)或可扩展标记语言(xml))来表示通过网络120交换的数据。在一些实施例中,可以使用任何合适的一项技术或多项技术来对网络120的所有或一些通信链路进行加密。
21.一个或更多个第三方系统130可以耦合到网络120,以与在线系统140进行通信,这将在下面结合图2进行进一步的描述。在一个实施例中,第三方系统130是应用提供者,其传送描述用于由客户端设备110执行的应用的信息,或者向客户端设备110传送数据以供在客户端设备110上执行的应用使用。在其他实施例中,第三方系统130(例如,内容发布者)通过客户端设备110提供用于呈现的内容或其他信息。第三方系统130还可以向在线系统140传送信息,诸如广告、内容或关于第三方系统130提供的应用的信息。
22.图2是在线系统140的架构的框图。图2所示的在线系统140包括用户简档储存器(store)205、内容储存器210、动作记录器215、动作日志220、边储存器225、主题储存器230、机器学习模块235、预测模块240、简档更新模块245、内容选择模块250和web服务器255。在其他实施例中,在线系统140可以包括用于各种应用的附加的、更少的或不同的部件。没有示出常规部件(例如网络接口、安全功能、负载平衡器、故障转移服务器、管理和网络操作控制台等),以便不使系统架构的细节模糊。
23.在线系统140的每个用户与被存储在用户简档储存器205中的用户简档相关联。用户简档包括由用户明确分享的关于用户的声明性信息,并且还可以包括由在线系统140推断的简档信息。在一个实施例中,用户简档包括多个数据字段,每个数据字段描述相应在线系统用户的一个或更多个属性。被存储在用户简档中的信息的示例包括传记信息、人口统计信息和其他类型的描述性信息(例如工作经历、教育历史、性别、爱好或偏好、位置等)。用户简档还可以存储用户提供的其他信息,例如图像或视频。在某些实施例中,可以用标识图像中显示的在线系统用户的信息来对用户的图像进行标记,其中标识用户被标记的图像的信息存储在用户的用户简档中。用户简档储存器205中的用户简档还可以维护对相应用户在内容储存器210中的内容项上执行的、并被存储在动作日志220中的动作的引用。
24.存储在用户简档储存器205中的信息可以由(下面描述的)简档更新模块245更新以包括在线系统140的用户对各种项目的亲和力。这样的项目的示例包括诸如服装项目、电子项目、鞋、汽车或任何其他合适类型的项目的产品。例如,假设在线系统140的用户具有对特定帽子(例如,特定样式、品牌、颜色等的帽子)的亲和力。在该示例中,通过与标识帽子的信息(例如,产品标识符)相关联地存储识别用户的信息(例如,与用户相关联的用户名),存储在用户简档储存器205中的信息可以被更新以包括用户对帽子的亲和力。在一些实施例中,在线系统140的用户具有亲和力的项目可以与存在于在线系统140上的实体相关联。例如,如果项目是产品,则与该产品相关联的实体可以是该产品的商家、制造商或经销商。在在线系统用户具有亲和力的项目与存在于在线系统140上的实体相关联的实施例中,存储
在用户简档储存器205中的描述用户对该项目的亲和力的信息可以指示该项目与该实体相关联。例如,标识在线系统140的用户的信息可以与标识用户具有亲和力的产品的信息和标识出售该产品的商家的信息(例如,与该商家相关联的用户名)相关联地存储在用户简档储存器205中。在一些实施例中,存储在用户简档储存器205中的信息也可以由简档更新模块245更新以包括在线系统用户对与存在于在线系统140上的实体相关联的项目的不喜欢(dislike),如下面进一步描述的。
25.存储在用户简档储存器205中的信息也可以由简档更新模块245更新以包括在线系统140的用户对各种主题的亲和力。这样的主题的示例包括产品的类型、服装的样式、音乐的流派、烹饪的类型等。例如,如果在线系统140的用户具有对各种样式、颜色和/或品牌的帽子的亲和力,则存储在用户简档储存器205中的信息可以被更新以包括用户对帽子的主题的亲和力(例如,通过与描述帽子的主题的信息相关联地存储标识用户的信息)。在一些实施例中,存储在用户简档储存器205中的信息也可以由简档更新模块245更新以包括在线系统用户对主题的不喜欢,如下面进一步描述的。
26.存储在用户简档储存器205中的信息也可以由简档更新模块245更新以包括在线系统140的用户对由其他个人使用的项目的亲和力。例如,假设在线系统140的用户具有对除用户之外的个人所穿戴的维多利亚式连衣裙(victorian dresses)的亲和力。在该示例中,存储在用户简档储存器205中的信息可以被更新以包括用户对除用户之外的个人所穿戴的维多利亚式连衣裙的亲和力。存储在用户简档储存器205中的信息也可以由简档更新模块245更新以包括在线系统140的用户对与其他个人所使用的项目相关联的主题的亲和力。在上述示例中,如果用户也具有对除用户之外的个人所穿戴的与维多利亚时代相关的帽子和鞋子的亲和力,则用户简档储存器205也可以被更新以包括用户对除用户之外的个人所穿戴的维多利亚风格的亲和力。
27.存储在用户简档储存器205中的信息还可以包括一个或更多个嵌入(embedding),每个嵌入描述在线系统用户对与存在于在线系统140上的实体相关联的项目的亲和力。嵌入可以由简档更新模块245生成并存储在用户简档储存器205中。例如,假设在线系统用户具有对牛仔裤的亲和力。在该示例中,简档更新模块245可以在用户产品嵌入空间中生成描述用户对牛仔裤的亲和力的嵌入,并且可以将该嵌入存储在用户简档储存器205中。在存储在用户简档储存器205中的信息被更新以包括在线系统140的用户对由其他个人使用的项目的亲和力的实施例中,描述这些亲和力的嵌入也可以由简档更新模块245生成并存储在用户简档储存器205中。在上述示例中,如果用户也具有对除用户之外的个人所穿着的牛仔裤的亲和力,则简档更新模块245可以在用户产品嵌入空间中生成描述用户对除用户之外的个人所穿着的牛仔裤的亲和力的附加嵌入,并且可以将该嵌入存储在用户简档储存器205中。
28.虽然用户简档储存器205中的用户简档通常与个人相关联,允许个人经由在线系统140彼此进行交互,但是也可以为诸如企业或组织的实体而存储用户简档。这允许实体在在线系统140中建立存在,用于与其他在线系统用户关连并交换内容。实体可以使用与该实体的用户简档相关联的品牌页面来发布关于其自身、关于其产品的信息或者向在线系统140的用户提供其他信息。在线系统140的其他用户可以关连到品牌页面以接收被发布到品牌页面的信息或者从品牌页面接收信息。与品牌页面相关联的用户简档可以包括关于实体
自身的信息,以向用户提供关于实体的背景或信息数据。
29.内容储存器210存储对象,这些对象各自表示各种类型的内容。由对象表示的内容的示例包括页面帖子、状态更新、照片、视频、链接、共享的内容项、游戏应用成就、本地企业处的签到(check

in)事件、页面(例如,品牌页面)、广告或任何其他类型的内容。在线系统用户可以创建由内容储存器210存储的对象,诸如状态更新、被用户标记为与在线系统140中的其他对象相关联的照片、事件、群组或应用。在一些实施例中,从第三方应用或独立于在线系统140的第三方应用接收对象。在一个实施例中,内容储存器210中的对象表示单条内容(single piece of content)或内容“项”。因此,通过经由各种通信渠道将文本和各种类型的媒体的内容项发布到在线系统140来鼓励在线系统用户与彼此进行通信。这增加了用户与彼此之间的交互的量,并增加了用户在在线系统140内交互的频率。
30.动作记录器215接收关于在线系统140内部和/或外部的用户动作的通信,用关于用户动作的信息填充动作日志220。动作的示例包括添加与另一用户的关连、向另一用户发送消息、上传图像、读取来自另一用户的消息、查看与另一用户相关联的内容以及参加由另一用户发布的事件。此外,许多动作可能涉及一个对象和一个或更多个特定用户,因此这些动作也与这些用户相关联并被存储在动作日志220中。
31.在线系统140可以使用动作日志220来跟踪在线系统140中的用户动作,以及跟踪向在线系统140传送信息的第三方系统130中的动作。用户可以与在线系统140中的各种对象交互,并且描述这些交互的信息被存储在动作日志220中。与对象的交互的示例包括:评论帖子、分享链接、经由客户端设备110在物理位置签到、访问内容项以及任何其他合适的交互。包括在动作日志220中的与在线系统140中的对象的交互的附加示例包括:评论相册、与用户通信、与对象建立关连、加入事件、加入群组、创建事件、授权应用、使用应用、表达对对象的偏好(“点赞(like)”对象)、以及参与交易。此外,动作日志220可以记录用户与在线系统140中的广告的交互以及与在线系统140中运行的其他应用的交互。在一些实施例中,来自动作日志220的数据被用于推断用户的兴趣或偏好,增强了用户的用户简档中包括的兴趣,并允许对用户偏好的更完整的理解。
32.动作日志220还可以存储在第三方系统130(例如外部网站)上采取的、并被传送给在线系统140的用户动作。例如,电子商务网站可以通过使电子商务网站能够识别在线系统140的用户的社交插件(social plug

in)来辨识在线系统140的用户。因为在线系统140的用户是唯一可识别的,所以(例如在前面的示例中)电子商务网站可以将关于用户于在线系统140外部的动作的信息传送给在线系统140,用于与用户进行关联。因此,动作日志220可以记录关于用户在第三方系统130上执行的动作的信息,包括网页浏览历史、参与的广告、完成的购买以及来自购物和购买的其他模式。此外,用户经由与第三方系统130相关联并在客户端设备110上运行的应用执行的动作可以被传送到动作记录器215,以由该应用存储在动作日志220中,用于由在线系统140记录并与用户相关联。
33.在一个实施例中,边储存器225将描述用户与在线系统140中的其他对象之间的关连的信息存储为边。某些边可以由用户定义,允许用户指定他们与其他用户的关系。例如,用户可以生成平行于用户的现实生活关系(例如朋友、同事、伙伴等等)的与其他用户的边。当用户与在线系统140中的对象交互(例如表达对在线系统140中的页面的兴趣、与在线系统140的其他用户分享链接、以及对由在线系统140的其他用户制作的帖子进行评论)时,生
成其他边。
34.在一个实施例中,边可以包括各种特征,每个特征表示用户之间的交互、用户和对象之间的交互或者对象之间的交互的特征。例如,边中包括的特征描述了两个用户之间的交互的速率、两个用户最近如何与彼此进行交互、一个用户检索关于对象的信息的速率或量、或者用户发布的关于对象的评论的数量和类型。这些特征还可以表示描述特定对象或用户的信息。例如,特征可以表示用户对特定主题的兴趣程度、用户登录在线系统140的速率、或者描述关于用户的人口统计信息的信息。每个特征可以与源对象或用户、目标对象或用户以及特征值相关联。特征可以被指定为基于描述源对象或用户、目标对象或用户、或者源对象或用户与目标对象或用户之间的交互的值的表达式;因此,边可以被表示为一个或更多个特征表达式。
35.边储存器225还存储关于边的信息,例如对象、兴趣和其他用户的亲和力分数(affinity score)。在线系统140可以随时间计算亲和力分数或“亲和力”,以基于用户执行的动作来近似用户对在线系统140中的另一用户或对象的兴趣。在线系统140可以随时间计算用户的亲和力,以基于用户执行的动作来近似用户对在线系统140中的另一用户、对象或主题的兴趣。在于2010年12月23日提交的第12/978,265号美国专利申请、于2012年11月30日提交的第13/690,254号美国专利申请、于2012年11月30日提交的第13/689,969号美国专利申请和于2012年11月30日提交的第13/690,088号美国专利申请中进一步描述了亲和力的计算,这些专利申请中的每一个专利申请都在此通过引用以其整体并入。在一个实施例中,用户和特定对象之间的多个交互可以作为单条边被存储在边储存器225中。替代地,用户和特定对象之间的每次交互都被存储为单独的边。在一些实施例中,用户之间的关连可以被存储在用户简档储存器205中,或者用户简档储存器205可以访问边储存器225以确定用户之间的关连。
36.主题储存器230存储描述可以与在线系统140的用户具有亲和力的项目相关联的各种主题的信息。这样的主题的示例包括项目的类别或类型,例如电子设备或其他产品的类别、服装的样式、电影的流派等。例如,对应于特定品牌(make)和型号的跑车的项目可以与汽车的主题相关联。存储在主题储存器230中的主题也可以包括更具体的主题(即,副主题)。在上面的示例中,汽车的主题可以包括比汽车的主题更特定的附加主题(例如,跑车、卡车、货车、轿车、suv等)。
37.在一些实施例中,存储在主题储存器230中的主题被排列在一个或更多个分级结构中。在这样的实施例中,分级结构包括表示主题的多个节点,并且连接节点的边表示在主题之间的关系。此外,分级结构的不同级别表示不同级别的特异性(specificity),使得由在分级结构的最低级别处的节点表示的主题对应于最特定级别的特异性,以及由在分级结构的最高级别处的节点表示的主题对应于最一般级别的特异性。例如,假设在主题的分级结构中,在分级结构的最高级别处的节点表示帽子的主题。在该示例中,由边连接到在分级结构的更高级别处的节点的每个附加节点可以表示与它连接到的在更高级别处的节点对应的主题内的更特定的主题(例如,帽子的样式、帽子的颜色、帽子的材料、帽子的品牌等)。下面结合图3和图4进一步描述主题储存器230。
38.机器学习模块235可以训练项目检测模型以预测内容项包括与存在于在线系统140上的实体(例如商家)相关联的项目(例如产品)的图像的概率。项目检测模型可以是卷
积神经网络、深度学习模型或任何其他合适的机器学习模型。在一些实施例中,机器学习模块235可以训练共同执行项目检测模型的功能的多个机器学习模型。在各种实施例中,机器学习模块235可以基于训练图像集来训练项目检测模型,其中训练图像集中的一些图像包括与存在于在线系统140上的实体相关联的项目的图像,而训练图像集中的一些图像不包括这些图像。在这样的实施例中,机器学习模块235还可以基于训练图像集中的每个图像的属性和指示训练图像集中的每个图像是否对应于与存在于在线系统140上的实体相关联的项目的信息来训练项目检测模型。可用于训练项目检测模型的图像的属性包括描述图像的尺寸、图像的分辨率、在图像内的一个或更多个像素的亮度、在图像内的一个或更多个像素的红色、绿色和蓝色分量强度等的一组像素值。
39.为了说明机器学习模块235可如何训练项目检测模型的示例,假设在线系统140接收与存在于在线系统140上的各种商家相关联的产品目录,其中每个产品目录包括由商家出售的产品的图像。在该示例中,产品的图像可以被包括在训练图像集中,该训练图像集还包括其他图像(例如,在线系统140的用户的图像、无生命物体(inanimate object)的图像、风景的图像等)。继续该示例,机器学习模块235可以使用训练图像集来训练项目检测模型,以基于在训练图像集中包括的每个图像的像素值以及指示这些图像中的每一个是否对应于由商家出售的产品的信息来预测内容项包括由商家出售的产品的图像的概率。
40.在一些实施例中,一旦被训练,项目检测模型就首先检测在内容项中包括的对象,且然后预测对象对应于与存在于在线系统140上的实体相关联的特定项目的概率。为了这么做,项目检测模型通过将一种或更多种对象检测方法应用于图像来检测在内容项中包括的图像内的一个或更多个对象。项目检测模型还可以识别在图像中检测到的对象的位置(例如,通过生成围绕每个对象的边界框)。在各种实施例中,项目检测模型使用一种或更多种对象检测方法来识别对应于图像中检测到的每个对象的项目的类型。例如,使用对象检测方法,项目检测模型基于对象的属性来使不同的类别或类型与对象相关联,使得项目检测模型基于对象的属性来使类别或类型(例如项目的类型)与在图像内检测到的每个对象相关联。项目检测模型然后通过将对象与和存在于在线系统140上的一个或更多个实体相关联的项目的图像(例如,在产品目录中包括的产品的图像)进行比较来做出一个或更多个预测,每个预测对应于在图像内检测到的对象对应于与存在于在线系统140上的实体相关联的特定项目的概率。项目检测模型然后输出图像内检测到的每个对象匹配与存在于在线系统140上的一个或更多个实体相关联的不同项目的一个或更多个概率。
41.在项目检测模型识别对应于内容项中包括的图像内检测到的对象的项目的类型的实施例中,机器学习模块235可以基于包括不同类型的项目的图像的训练图像集来训练项目检测模型。在一些实施例中,训练图像集可以包括识别不同类型的项目的可公开得到的信息。也可以基于表征训练图像集中的每个图像的属性(例如形状、边缘、曲线等)以及指示对应于训练图像集中的每个图像的项目的类型的信息来训练项目检测模型。
42.在项目检测模型预测图像内检测到的对象对应于与存在于在线系统140上的实体相关联的特定项目的概率的实施例中,机器学习模块235可以基于在图像内检测到的对象与和存在于在线系统140上的一个或更多个实体相关联的项目的图像的比较来训练项目检测模型。在一些实施例中,机器学习模块235训练项目检测模型,以基于在图像内检测到的对象与和存在于在线系统140上的实体相关联的不同项目的先前匹配来预测图像内检测到
的对象匹配与存在于在线系统140上的实体相关联的项目的概率。例如,机器学习模块235基于对象的属性(例如,徽标、商标、厂标、图标、图案、纹理、印刷品等)来将标记(label)应用于图像内检测到的对象,指示对象匹配与实体相关联的项目。根据从图像提取的对象的所标记的属性,机器学习模块235使用任何合适的训练方法或训练方法的组合(例如,如果项目检测模型是神经网络,则使用反向传播,如果项目检测模型是线性回归模型,则使用曲线拟合技术,等等)来训练项目检测模型。
43.在各种实施例中,机器学习模块235还可以训练用户识别模型以预测内容项包括在线系统140的用户的图像的概率。类似于上面所述的项目检测模型,用户识别模型可以是卷积神经网络、深度学习模型或任何其他合适的机器学习模型。同样类似于项目检测模型,在一些实施例中,机器学习模块235可以训练共同执行用户识别模型的功能的多个机器学习模型。在一些实施例中,机器学习模块235可以基于训练图像集来训练用户识别模型,其中训练图像集中的一些图像包括在线系统140的用户的图像,而训练图像集中的一些图像不包括用户的图像。在这样的实施例中,机器学习模块235还可以基于训练图像集中每个图像的属性和指示训练图像集中每个图像是否对应于在线系统140的用户的信息来训练用户识别模型。类似于项目检测模型,可用于训练用户识别模型的图像的属性包括与图像相关联的一组像素值。
44.为了说明机器学习模块235可如何训练用户识别模型的示例,假设在线系统140接收在线系统140的用户的图像(例如,将被包括在用户的用户简档中的图像、被包括在内容项中的图像(其中用户被标记)等)。在该示例中,用户的图像可以被包括在训练图像集中,该训练图像集还包括其他图像(例如,无生命物体的图像、风景的图像等)。继续该示例,机器学习模块235可以使用训练图像集来训练用户识别模型,以基于训练图像集中包括的每个图像的像素值以及指示这些图像中的每个图像是否对应于在线系统140的用户的信息来预测内容项包括在线系统用户的图像的概率。
45.在一些实施例中,一旦被训练,用户识别模型就首先检测被包括在内容项中的脸的图像,且然后预测脸对应于在线系统140的特定用户的脸的概率。为了这么做,用户识别模型通过将一种或更多种面部检测方法应用于图像来检测内容项中包括的图像内的一个或更多个脸。用户识别模型还可以识别图像内检测到的脸的位置(例如,通过生成围绕每张脸的边界框)。在各种实施例中,用户识别模型使用一种或更多种面部检测方法来识别对应于图像内检测到的每张脸的脸类型。例如,使用面部检测方法,用户识别模型基于脸的属性来使不同的类别或类型与脸相关联,使得用户识别模型基于脸的属性来使类别或类型(例如,人脸、狗脸等)与图像内检测到的每张脸相关联。用户识别模型通过将脸与在线系统140的用户的脸的图像(例如,存储在用户简档储存器205中的简档图像、存储在内容储存器210中的图像(其中用户被标记)等)进行比较来做出一个或更多个预测,每个预测对应于图像内检测到的脸对应于在线系统140的特定用户的脸的概率。用户识别模型然后输出图像中检测到的每张脸匹配在线系统140的一个或更多个用户的不同脸的一个或更多个概率。
46.在用户识别模型识别与在内容项中包括的图像内检测到的脸对应的脸的类型的实施例中,机器学习模块235可以基于包括不同类型的脸的图像的训练图像集来训练用户识别模型。在一些实施例中,训练图像集可以包括识别不同类型的脸的可公开得到的信息。也可以基于表征训练图像集中的每个图像的属性(例如面部特征的类型、形状、尺寸、颜色
和面部特征的位置等)以及指示与训练图像集中的每个图像对应的脸的类型的信息来训练用户识别模型。
47.在用户识别模型预测图像内检测到的脸对应于在线系统140的特定用户的脸的概率的实施例中,机器学习模块235可以基于图像内检测到的脸与在线系统140的用户的图像的比较来训练用户识别模型。在一些实施例中,机器学习模块235训练用户识别模型,以基于图像内检测到的脸与不同用户的先前匹配来预测图像内检测到的脸与在线系统用户的脸匹配的概率。例如,机器学习模块235基于脸的属性(例如,眼睛、鼻子、颧骨和其他面部特征的形状和大小、在面部特征之间的距离等)来将标记应用于图像内检测到的脸,指示该脸匹配在线系统用户的脸。根据从图像提取的脸的所标记的属性,机器学习模块235使用任何合适的训练方法或训练方法的组合(例如,如果用户识别模型是神经网络,则使用反向传播,如果用户识别模型是线性回归模型,则使用曲线拟合技术,等等)来训练用户识别模型。下面结合图3进一步描述机器学习模块235的功能。
48.预测模块240(例如,如在图3的步骤315中所示的)访问经训练的项目检测模型并(例如,如在图3的步骤320中所示的)应用项目检测模型以预测内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率。在一些实施例中,项目检测模型可以由机器学习模块235训练,而在其他实施例中,项目检测模型可以由第三方系统130训练。为了使用项目检测模型来预测内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率,预测模块240向项目检测模型提供输入,该输入包括在内容项中包括的图像的一个或更多个属性(例如,在图像内的一个或更多个像素的一组像素值)。基于这些属性,项目检测模型预测内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率。预测模块240然后从项目检测模型接收对应于所预测的概率的输出。在一些实施例中,预测模块240可以访问和应用多个机器学习模型,这些机器学习模型以类似方式共同执行项目检测模型的功能。
49.预测模块240还可以访问经训练的用户识别模型,并应用用户识别模型以预测内容项包括在线系统140的用户的图像的概率。在一些实施例中,用户识别模型可以由机器学习模块235训练,而在其他实施例中,用户识别模型可以由第三方系统130训练。在各种实施例中,预测模块240可以访问并应用用户识别模型以响应于从项目检测模型接收到指示内容项包括与存在于在线系统140上的实体相关联的项目的图像(例如,在由项目检测模型预测的概率至少是阈值概率的情况下)的输出,来预测内容项包括在线系统140的用户的图像的概率。为了使用用户识别模型来预测内容项包括在线系统140的用户的图像的概率,预测模块240向用户识别模型提供输入,该输入包括在内容项中包括的图像的一个或更多个属性(例如,图像内的一个或更多个像素的一组像素值)。基于这些属性,用户识别模型预测内容项包括在线系统140的用户的图像的概率。预测模块240然后从用户识别模型接收对应于所预测的概率的输出。在一些实施例中,预测模块240可以访问和应用多个机器学习模型,该多个机器学习模型以类似方式共同执行用户识别模型的功能。下面结合图3进一步描述预测模块240的功能。
50.简档更新模块245基于由项目检测模型预测的概率来(例如,如在图3的步骤325中所示的)更新在线系统140的用户的简档,以包括用户对与存在于在线系统140上的实体相关联的项目的亲和力。简档更新模块245可以响应于确定由项目检测模型预测的概率至少
是阈值概率来这样做。例如,一旦项目检测模型预测了从在线系统140的用户接收的内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率,简档更新模块245可以将所预测的概率与阈值概率进行比较。在该示例中,如果所预测的概率至少是阈值概率,则简档更新模块245可以更新在用户简档储存器205中的用户简档以包括用户对项目的亲和力。
51.简档更新模块245还可以更新在线系统140的用户的简档以包括用户对与一个或更多个项目相关联的主题的亲和力,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。简档更新模块245可以通过将由项目检测模型预测的内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率与一个或更多个阈值概率进行比较来这样做,其中每个阈值概率与主题相关联。简档更新模块245然后可以基于该比较来确定与内容项相关联的主题,并且更新在线系统140的用户的简档以包括用户对该主题的亲和力。例如,假设项目检测模型预测了内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率,其中该项目对应于特定样式和颜色的一双鞋。在该示例中,如果概率小于阈值概率,则简档更新模块245可以访问(例如,存储在主题储存器230中的)主题的分级结构,并从分级结构的最特定的级别处的主题开始将所预测的概率与和每个主题(例如,鞋的样式、颜色、品牌和/或材料)相关联的概率进行比较。在该示例中,如果所预测的概率至少是与主题相关联的阈值概率,则简档更新模块245可以确定内容项与主题相关联。继续该示例,简档更新模块245然后可以更新内容项被接收自的用户的简档以包括用户对主题的亲和力。
52.简档更新模块245还可以基于由用户识别模型预测的概率来(例如,如在图3的步骤325中所示的)更新在线系统140的用户的简档,以包括用户对与存在于在线系统140上的实体相关联的项目的亲和力。在一些实施例中,简档更新模块245可以确定由用户识别模型预测的概率是否至少是阈值概率。在这样的实施例中,基于该确定,简档更新模块245可以更新在线系统140的用户的简档以包括用户对项目的亲和力或者用户对由除用户之外的个人使用的项目的亲和力。例如,假设项目检测模型预测了从在线系统140的用户接收的内容项包括与存在于在线系统140上的实体相关联的服装物品(article of clothing)的图像的第一概率,并且第一概率至少是第一阈值概率。在该示例中,还假设用户识别模型预测了内容项包括内容项被接收自的用户的图像的第二概率。在该示例中,如果简档更新模块245确定第二概率至少是第二阈值概率,则简档更新模块245可以更新用户简档储存器205中的用户简档以描述用户对用户所穿戴的服装物品的品味(taste)。替代地,在上述示例中,如果简档更新模块245确定第二概率小于第二阈值概率,则简档更新模块245可以更新用户的简档以描述用户对由除用户之外的个人所穿戴的服装物品的品味。
53.简档更新模块245还可以基于由用户识别模型预测的概率来更新在线系统140的用户的简档,以包括用户对与一个或更多个项目相关联的主题的亲和力,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。如上所述,在一些实施例中,简档更新模块245可以确定与内容项相关联的主题。在这样的实施例中,基于由用户识别模型预测的概率,简档更新模块245可以更新在线系统140的用户的简档以包括用户对与由用户使用的项目相关联的主题的亲和力或者用户对与由除用户之外的个人使用的项目相关联的主题的亲和力。例如,假设简档更新模块245确定内容项与复古服装(vintage clothing)的主题相关联。在该示例中,如果简档更新模块245还确定由用户识别模型预测的内容项包
括内容项被接收自的在线系统用户的图像的概率至少是阈值概率,则简档更新模块245可以更新用户简档储存器205中的用户简档以描述用户对用户所穿戴的复古服装的品味。替代地,在上述示例中,如果简档更新模块245确定由用户识别模型预测的概率小于阈值概率,则简档更新模块245可以更新用户的简档以描述用户对除用户之外的个人所穿戴的复古服装的品味。
54.在一些实施例中,简档更新模块245可以通过生成描述用户对项目的亲和力的嵌入并接着将该嵌入存储在用户简档储存器205中来(例如,如在图3的步骤325中所示的)更新在线系统140的用户的简档,以包括用户对与存在于在线系统140上的实体相关联的项目的亲和力。例如,假设项目检测模型预测了内容项包括对应于短夹克的项目的图像的第一概率,并且第一概率至少是第一阈值概率。在该示例中,还假设用户识别模型预测了内容项包括与内容项交互的在线系统140的用户的图像的第二概率,并且第二概率至少是第二阈值概率。在上述示例中,简档更新模块245可以在用户产品嵌入空间中生成描述用户对用户所穿戴的短夹克的亲和力的嵌入,并且可以将该嵌入存储在用户简档储存器205中。替代地,在上述示例中,如果第二概率小于第二阈值概率,则简档更新模块245可以在用户产品嵌入空间中生成描述用户对除用户之外的个人所穿戴的短夹克的亲和力的嵌入,并且可以将该嵌入存储在用户简档储存器205中。
55.在通过嵌入来描述在线系统用户对与存在于在线系统140上的实体相关联的项目的亲和力的实施例中,简档更新模块245还可以基于嵌入来更新用户的简档以包括用户对与该项目相关联的主题的亲和力。在这样的实施例中,简档更新模块245可以确定与嵌入的集群(cluster)相关联的主题,并且可以基于该确定来更新用户的简档以包括用户对该主题的亲和力。例如,假设用户产品嵌入空间中的不同嵌入对应于在线系统140的用户具有亲和力的不同产品(例如,晚礼服、无尾礼服、牛仔裤等)。在该示例中,嵌入的不同集群可以对应于不同风格的服装(例如,哥特式、休闲式等),使得与相隔更远的嵌入相比,靠得更近的嵌入对应于更可能属于同一风格的服装的项目。继续该示例,如果存储在用户简档储存器205中的嵌入描述在线系统用户对诸如有饰章的运动夹克(crested blazer)和条纹领带的项目的亲和力,则简档更新模块245可以确定这些嵌入被包括在对应于预科生风格(preppy style)的服装的集群中。在上面的示例中,基于该确定,简档更新模块245可以更新用户的简档以包括用户对预科生风格的服装的亲和力。
56.在一些实施例中,简档更新模块245还可以更新在线系统140的用户的简档,以包括用户对与存在于在线系统140上的实体相关联的项目和/或对与一个或更多个项目相关联的主题的不喜欢,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。在这样的实施例中,简档更新模块245可以基于由项目检测模型预测的概率以及用户与内容项的交互来这样做。例如,假设在线系统140的用户执行与内容项的交互,其指示对内容项的不喜欢(例如,取消订阅由创建内容项的在线系统用户创建的内容、将内容项报告为不合适的等)。在该示例中,一旦项目检测模型预测了内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率,简档更新模块245可以将所预测的概率与阈值概率进行比较。在上述示例中,如果所预测的概率至少是阈值概率,则简档更新模块245可以更新在用户简档储存器205中的用户简档以包括用户对该项目的不喜欢。在上述示例中,如果简档更新模块245此外或替代地确定与内容项相关联的主题,则简档更新模块245可以更新
用户的简档以包括用户对该主题的不喜欢。下面结合图3、图4和图5进一步描述简档更新模块245的功能。
57.内容选择模块250可以识别有资格被呈现给在线系统140的观看用户的一个或更多个候选内容项。内容选择模块250从内容储存器210或从另一个源检索有资格呈现给观看用户的候选内容项,内容选择模块250可以对候选内容项进行排名,并(例如,如在图3的步骤335中所示的)选择一个或更多个候选内容项来呈现给观看用户。有资格被呈现给观看用户的候选内容项是与由观看用户的特征满足的至少阈值数量的定位标准相关联的内容项,或者是与定位标准不相关联的内容项。在各种实施例中,内容选择模块250包括在一个或更多个内容选择过程(其识别用于呈现给观看用户的一组内容项)中有资格被呈现给观看用户的候选内容项。例如,内容选择模块250基于在线系统140与观看用户相关联的特征,并基于观看用户对不同候选内容项的亲和力,来确定各种候选内容项与观看用户的相关性的度量。基于相关性的度量,内容选择模块250选择内容项以呈现给观看用户。作为另外的示例,内容选择模块250选择具有最高相关性度量或至少具有阈值相关性度量的内容项,以呈现给观看用户。替代地,内容选择模块250基于候选内容项的相关联的相关性度量对其进行排名,并选择在排名中具有靠前位置或者在排名中具有至少阈值位置的内容项以呈现给观看用户。
58.被选择用于呈现给观看用户的内容项可以与出价金额相关联。当选择呈现给观看用户的内容时,内容选择模块250可以使用与候选内容项相关联的出价金额。在各种实施例中,内容选择模块250基于各种候选内容项的出价金额来确定与各种候选内容项相关联的期望值,并且选择与最大期望值相关联或者与至少阈值期望值相关联的内容项以呈现给观看用户。与候选内容项相关联的期望值表示对在线系统140呈现候选内容项的预期的报酬(compensation)金额。例如,与候选内容项相关联的期望值是候选内容项的出价金额和观看用户与来自候选内容项的内容交互的可能性的乘积。内容选择模块250可以基于候选内容项的相关出价金额对其进行排名,并选择在排名中至少具有阈值位置的内容项以呈现给观看用户。在一些实施例中,内容选择模块250基于与候选内容项相关联的出价金额和相关性度量,在统一的排名中对不与出价金额相关联的候选内容项和与出价金额相关联的候选内容项进行排名。基于统一排名,内容选择模块250选择内容以呈现给观看用户。在2012年7月10日提交的美国专利申请第13/545,266号中进一步描述了通过统一排名选择内容项,该申请通过引用以其整体结合于此。
59.例如,内容选择模块250接收向在线系统140的观看用户呈现内容信息流(feed)的请求。该信息流可以包括一个或更多个广告以及其他内容项,例如描述与关连到观看用户的其他在线系统用户相关联的动作的动态(story)。内容选择模块250访问用户简档储存器205、内容储存器210、动作日志220和边储存器225中的一个或更多个,以检索关于观看用户的信息。例如,检索与关连到观看用户的用户相关联的动态或其他数据。检索到的动态或其他内容项由内容选择模块250分析以识别可能与观看用户相关的候选内容。例如,与未关连到观看用户的用户相关联的动态或者与观看用户具有小于阈值亲和力的用户相关联的动态被放弃为候选内容。基于各种标准,内容选择模块250选择被识别为候选内容的一个或更多个内容项以呈现给观看用户。所选择的内容项可以被包括在呈现给观看用户的内容信息流中。例如,内容的信息流包括描述与通过在线系统140关连到观看用户的用户相关联的动
作的至少阈值数量的内容项。
60.在各种实施例中,内容选择模块250通过动态消息(newsfeed)向观看用户呈现内容,该动态消息包括被选择用于呈现给观看用户的多个内容项。一个或更多个广告也可以被包括在信息流中。内容选择模块250还可以确定所选择的内容项经由信息流被呈现的顺序。例如,内容选择模块250基于观看用户与各种内容项交互的可能性来对信息流中的内容项进行排序。下面结合图3进一步描述内容选择模块250的功能。
61.web服务器255经由网络120将在线系统140链接到一个或更多个客户端设备110以及链接到一个或更多个第三方系统130。web服务器255提供网页以及其他内容,例如xml等。web服务器255可以接收消息并在在线系统140和客户端设备110之间路由该消息(例如即时消息、排队消息(例如,电子邮件)、文本消息、短消息服务(sms)消息或使用任何其他合适的消息传送技术发送的消息)。用户可以向web服务器255发送上传存储在内容储存器210中的信息(例如,图像或视频)的请求。此外,web服务器255可以提供应用编程接口(api)功能,以将数据直接发送到本机客户端设备操作系统,例如android
tm
、或blackberryos。
62.基于从用户接收的内容和/或用户与之交互的内容中包括的项目的图像来更新在线系统用户的简档以包括对项目的亲和力
63.图3是用于基于从用户接收的内容和/或用户与之交互的内容中包括的项目的图像来更新在线系统用户的简档以包括对项目的亲和力的方法的流程图。在其他实施例中,该方法可以包括与图3所示的步骤相比不同的和/或附加的步骤。另外,可以以与结合图3描述的顺序不同的顺序来执行该方法的步骤。
64.在线系统140从在线系统140的内容提供用户接收305内容项,其中内容项包括图像。例如,在线系统140可以从内容提供用户接收305包括标题和图像的内容项。在一些实施例中,另外或替代地,内容项可以包括附加数据,例如视频数据、音频数据、文本数据(例如,在一个或更多个标签中)、一个或更多个附加图像等。在内容项包括视频数据的实施例中,图像可以被包括在视频数据中。例如,图像可以被包括在视频的一个或更多个帧中,该视频被包括在从内容提供用户接收305的内容项中。
65.在一些实施例中,在线系统140可以从内容项被呈现给的在线系统140的观看用户接收310与内容项的交互。交互的类型的示例包括点击内容项、表达对内容项的偏好、评论内容项、保存内容项、与在线系统140的其他用户共享内容项、取消订阅由创建内容项的在线系统用户创建的内容、将内容项报告为不合适的等。例如,在线系统140可以从在线系统140的观看用户接收310对内容项的评论,其中该评论包括文本内容和描述观看用户对内容项的热情的表情符号(emoji)。
66.在线系统140然后(例如,使用预测模块240)访问315经训练的项目检测模型,并(例如,使用预测模块240)应用320项目检测模型以预测内容项包括与存在于在线系统140上的实体相关联的项目的图像的概率。如上所述,该项目可以是诸如服装项目、电子项目等的产品,并且该实体可以是项目的商家、制造商或经销商。另外如上所述,在一些实施例中,在线系统140可以访问和应用多个经训练的机器学习模型,该多个经训练的机器学习模型共同执行项目检测模型的功能。
67.为了应用320项目检测模型,在线系统140向项目检测模型提供输入,该输入包括
在内容项中包括的图像的一个或更多个属性(例如,图像内的一个或更多个像素的一组像素值)。基于这些属性,项目检测模型预测内容项包括与实体相关联的项目的图像的概率。在一些实施例中,项目检测模型首先通过将一种或更多种对象检测方法应用于图像来检测图像内的一个或更多个对象。项目检测模型还可以识别图像内检测到的对象的位置(例如,通过生成围绕每个对象的边界框)。在各种实施例中,项目检测模型使用一种或更多种对象检测方法来识别对应于图像内检测到的每个对象的项目的类型。项目检测模型然后通过将图像内检测到的每个对象与和实体相关联的项目的图像(例如,在产品的目录中包括的产品的图像)进行比较来做出与该对象对应于与实体相关联的项目的概率相对应的预测。在线系统140然后从项目检测模型接收对应于所预测的概率的输出。
68.在一些实施例中,在线系统140还可以(例如,使用预测模块240)访问经训练的用户识别模型,并(例如,使用预测模块240)应用用户识别模型以预测内容项包括内容提供用户和/或观看用户(此后被称为“对象用户”)的图像的概率。如上所述,在一些实施例中,在线系统140可以访问和应用共同执行用户识别模型的功能的多个经训练的机器学习模型。在各种实施例中,在线系统140可以访问并应用用户识别模型以响应于从项目检测模型接收到指示内容项包括与实体相关联的项目的图像(例如,在由项目检测模型预测的概率至少是阈值概率的情况下)的输出,来预测内容项包括对象用户的图像的概率。
69.为了应用用户识别模型,在线系统140向用户识别模型提供输入,该输入包括在内容项中包括的图像的一个或更多个属性(例如,在图像内的一个或更多个像素的一组像素值)。在一些实施例中,用户识别模型首先检测在内容项中包括的脸的图像,且然后预测脸对应于对象用户的脸的概率。用户识别模型可以通过将一种或更多种面部检测方法应用于图像来检测图像内的一个或更多个脸。用户识别模型还可以识别在图像内检测到的脸的位置(例如,通过生成围绕每张脸的边界框)。在各种实施例中,用户识别模型使用一种或更多种面部检测方法来识别与图像内检测到的每张脸对应的脸的类型(例如,人脸、狗脸等)。用户识别模型然后通过将脸与对象用户的脸的一个或更多个图像(例如,存储在用户简档储存器205中的简档图像、存储在内容储存器210中的图像(其中用户被标记)等)进行比较来做出对应于在图像内检测到的每张脸对应于对象用户的脸的概率的预测。在线系统140然后从用户识别模型接收对应于所预测的概率的输出。
70.在线系统140然后基于由项目检测模型预测的概率来(例如,使用简档更新模块245)更新325对象用户的简档以包括对象用户对与实体相关联的项目的亲和力。在一些实施例中,在线系统140可以响应于确定由项目检测模型预测的概率至少是阈值概率而这样做。例如,一旦项目检测模型预测了内容项包括与实体相关联的项目的图像的概率,在线系统140可以将所预测的概率与阈值概率进行比较。在该示例中,如果所预测的概率至少是阈值概率,则在线系统140可以更新325在用户简档储存器205中的对象用户的简档以包括对象用户对项目的亲和力。如上所述,在一些实施例中,在线系统140可以通过生成描述对象用户对项目的亲和力的嵌入并接着将该嵌入存储在用户简档储存器205中来更新325对象用户的简档。
71.在一些实施例中,在线系统140另外或替代地可以(例如,使用简档更新模块245)更新对象用户的简档,以包括对象用户对与一个或更多个项目相关联的主题的亲和力,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。在这样的实施例
中,在线系统140可以通过将由项目检测模型预测的内容项包括与实体相关联的项目的图像的概率与一个或更多个阈值概率进行比较来这样做,其中每个阈值概率与主题相关联。在线系统140然后可以基于该比较来确定与内容项相关联的主题,并且更新对象用户的简档以包括对象用户对该主题的亲和力。在一些实施例中,在线系统140可以访问主题的分级结构(例如,存储在主题储存器230中),并且从分级结构的最特定的级别处的主题开始将由项目检测模型预测的概率与和每个主题相关联的概率进行比较。在这样的实施例中,如果由项目检测模型预测的概率至少是与主题相关联的阈值概率,则在线系统140可以确定内容项与主题相关联,并且在线系统140然后可以更新对象用户的简档以包括对象用户对主题的亲和力。
72.图4示出了主题的分级结构的示例,在线系统140可以访问该主题的分级结构以确定内容项是否与主题相关联。假设项目检测模型预测了内容项包括与实体相关联的项目的图像的概率,其中项目对应于特定帽子。如果概率小于阈值概率,则在线系统140可以访问主题410的分级结构400,其中分级结构400的不同级别表示不同级别的特异性,并且连接对应于主题410的节点的边表示主题410之间的关系。由分级结构400的最低级别处的节点表示的主题410e对应于最特定级别的特异性,且由分级结构400的最高级别处的节点表示的主题410a(即,帽子)对应于最一般的级别的特异性。例如,节点420表示对应于无边小便帽样式(beanie style)410b的、蓝色410c的、羊毛材料410d的和品牌a品牌410e的帽子项目类型410a。从由分级结构400的最低级别处的节点表示的主题410e开始,在线系统140可以将由项目检测模型预测的概率与和由分级结构400的该级别处的节点表示的每个主题410e相关联的阈值概率进行比较。在线系统140可以用与由分级结构400的越来越高的级别处的节点表示的主题410a

410d相关联的阈值概率重复该过程,直到由项目检测模型预测的概率至少是与主题410相关联的阈值概率为止。一旦在线系统140确定由项目检测模型预测的概率至少是与主题410相关联的阈值概率,在线系统140就可以确定内容项与主题410相关联,并且可以更新对象用户的简档以包括对象用户对主题410的亲和力。
73.在对象用户对与实体相关联的项目的亲和力通过嵌入被描述的实施例中,在线系统140还可以基于嵌入来更新对象用户的简档,以包括对象用户对与项目相关联的主题的亲和力。在这样的实施例中,在线系统140可以确定与嵌入的集群相关联的主题,并且可以基于该确定来更新对象用户的简档以包括对象用户对该主题的亲和力。如在图5的示例中所示的,假设用户产品嵌入空间500中的不同嵌入对应于在线系统140的用户可能具有亲和力的不同产品(例如,诸如晚礼服、无尾礼服、牛仔裤等的服装和配饰)。在该示例中,嵌入的不同集群505可以对应于不同风格的服装(即,哥特式、休闲式、预科生式和优雅式),使得与相隔更远的嵌入相比,靠得更近的嵌入对应于更可能属于同一风格的服装的项目。继续该示例,如果存储在用户简档储存器205中的嵌入描述了对象用户对诸如牛仔裤和短夹克的项目的亲和力,则在线系统140可以确定这些嵌入被包括在对应于休闲风格的服装的集群中。在上述示例中,基于该确定,在线系统140可以更新对象用户的简档以包括对象用户对休闲风格的服装的亲和力。
74.返回参考图3,在一些实施例中,在线系统140还可以基于由用户识别模型预测的概率来(例如使用简档更新模块245)更新325对象用户的简档,以包括对象用户对与实体相关联的项目的亲和力。在这样的实施例中,在线系统140可以确定由用户识别模型预测的概
率是否至少是阈值概率。基于该确定,在线系统140可以更新325对象用户的简档,以包括对象用户对该项目的亲和力或者对象用户对由其他个人使用的项目的亲和力。例如,假设项目检测模型预测了内容项包括与实体相关联的服装物品的图像的第一概率,并且第一概率至少是第一阈值概率。在该示例中,还假设用户识别模型预测了内容项包括对象用户的图像的第二概率。在上述示例中,如果在线系统140确定第二概率至少是第二阈值概率,则在线系统140可以更新325在用户简档储存器205中的对象用户的简档,以描述对象用户对对象用户所穿戴的服装物品的品味。替代地,在上述示例中,如果在线系统140确定第二概率小于第二阈值概率,则在线系统140可以更新325对象用户的简档,以描述对象用户对除对象用户之外的个人所穿戴的服装物品的品味。
75.在一些实施例中,在线系统140还可以基于由用户识别模型预测的概率来更新对象用户的简档,以包括对象用户对与一个或更多个项目相关联的主题的亲和力,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。如上所述,在一些实施例中,在线系统140可以确定与内容项相关联的主题。在这样的实施例中,在线系统140还可以基于由用户识别模型预测的概率来更新对象用户的简档,以包括对象用户对与对象用户所使用的项目相关联的主题的亲和力或者对象用户对与除对象用户之外的个人所使用的项目相关联的主题的亲和力。
76.在各种实施例中,在线系统140还可以(例如使用简档更新模块245)更新对象用户的简档,以包括对与实体相关联的项目和/或对与一个或更多个项目相关联的主题的不喜欢,该一个或更多个项目与存在于在线系统140上的一个或更多个实体相关联。在这样的实施例中,在线系统140可以基于由项目检测模型预测的概率以及对象用户与内容项的交互来这样做。例如,假设观看用户执行了与内容项的交互,该交互指示对内容项的不喜欢(例如,取消订阅由内容提供用户创建的内容、将内容项报告为不合适的等)。在该示例中,一旦项目检测模型预测了内容项包括与实体相关联的项目的图像的概率,在线系统140可以将所预测的概率与阈值概率进行比较。在上述示例中,如果所预测的概率至少是阈值概率,则在线系统140可以更新用户简档储存器205中的观看用户的简档,以包括观看用户对项目的不喜欢。在上述示例中,如果在线系统140另外或替代地确定与内容项相关联的主题,则在线系统140可以更新观看用户的简档以包括观看用户对该主题的不喜欢。
77.在线系统140然后确定330向对象用户呈现内容的机会。例如,在线系统140可以在从对象用户接收到查看与对象用户的用户简档相关联的内容项的信息流的请求时确定330向对象用户呈现内容的机会。作为附加示例,在线系统140可以在从对象用户接收到刷新与对象用户的用户简档相关联的内容项的信息流的请求时确定330向对象用户呈现内容的机会。
78.在线系统140然后基于对象用户的已更新简档来(例如使用内容选择模块250)选择335一个或更多个内容项来呈现给对象用户。在一些实施例中,在线系统140可以通过首先识别有资格被呈现给对象用户的一组候选内容项来选择335内容项以用于呈现给对象用户。在这样的实施例中,在线系统140然后可以基于对象用户的已更新简档来预测对象用户对该组候选内容项中的每一个的亲和力。在线系统140然后可以对候选内容项进行排名,并选择335在排名中具有靠前位置或者在排名中具有至少阈值位置的一个或更多个内容项来呈现给对象用户。
79.一旦在线系统140选择了335内容项,在线系统140发送340所选择的内容项以用于呈现给对象用户。例如,在线系统140可以在内容项的信息流中包括所选择的内容项,该信息流被发送用于显示在与对象用户相关联的客户端设备110的显示区域中。在在线系统140(在步骤335中)选择多个内容项用于呈现给对象用户的实施例中,可以基于对象用户的已更新简档来确定内容项被发送用于显示给对象用户的顺序。例如,如果两个内容项被选择335用于显示给对象用户,则在在线系统140基于对象用户的已更新简档预测对象用户更可能具有对第一内容项的比对第二内容项更大的亲和力的情况下,在线系统140可以在内容项的信息流的更显著位置上包括第一内容项,并且在内容项的信息流的不太显著的位置上包括第二内容项。在该示例中,在线系统140然后可以发送340内容项的信息流用于显示给对象用户。
80.总结
81.为了说明的目的提出了实施例的前述描述;它并不旨在是无遗漏的或将专利权限制到所公开的精确形式。相关领域的技术人员可以理解,根据上述公开,许多修改和变化是可能的。
82.本描述的一些部分从对信息的操作的算法和符号表示方面描述了实施例。数据处理领域的技术人员通常使用这些算法描述和表示来向本领域的其他技术人员有效地传达他们工作的实质。这些操作虽然在功能上、计算上或逻辑上进行了描述,但应理解为将由计算机程序或等效电路、微代码等来实现。此外,在不失一般性的情况下,将这些操作安排称为模块有时也被证明是方便的。所描述的操作和它们的相关模块可以体现在软件、固件、硬件或其任何组合中。
83.可以利用一个或更多个硬件或软件模块单独地或与其他设备组合地来执行或实现本文描述的任何步骤、操作或过程。在一个实施例中,利用包括包含计算机程序代码的计算机可读介质的计算机程序产品来实现软件模块,计算机程序代码可以由计算机处理器执行,用于执行所描述的任何或全部步骤、操作或过程。
84.实施例还可以涉及用于执行本文的操作的装置。该装置可以被特别构造成用于所需的目的,和/或它可以包括由存储在计算机中的计算机程序选择性地激活或重新配置的通用计算设备。这种计算机程序可以存储在非暂时性的、有形的计算机可读存储介质中,或者适于存储电子指令的任何类型的介质中,其可以耦合到计算机系统总线。此外,说明书中提到的任何计算系统可以包括单个处理器,或者可以是采用多处理器设计来提高计算能力的架构。
85.实施例还可以涉及通过本文描述的计算过程产生的产品。这样的产品可以包括由计算过程产生的信息,其中信息被存储在非暂时性的、有形的计算机可读存储介质上且可以包括计算机程序产品或本文所述的其他数据组合的任何实施例。
86.最后,在说明书中使用的语言主要为了可读性和指导目的而被选择,并且它可以不被选择来描绘或限制创造性主题。因此,意图是本专利权的范围不受该详细描述限制,而是受在基于此的申请上所发布的任何权利要求限制。因此,实施例的公开内容意图对本专利权的范围是说明性的,而不是限制性的,本专利权的范围在所附的权利要求中阐述。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1