基于设备被链接的概率来选择设备内容的系统与方法与流程

文档序号:11450550阅读:259来源:国知局
基于设备被链接的概率来选择设备内容的系统与方法与流程

相关申请的交叉引用

本申请要求2015年7月22日提交的题为“systemsandmethodsforselectingcontentbasedonlinkeddevices(用于基于链接的设备选择内容的系统与方法)”的美国专利申请no.14/806,268的权益和优先权,其全部内容为所有目的通过引用并入本文。



背景技术:

在诸如互联网的联网环境中,诸如人或公司的实体提供用于由计算设备在web页面或其它接口上显示的信息。web页面可以包括由实体经由web页面服务器提供的用于在互联网上显示的文本、视频或音频信息。也可以由第三方提供诸如电子广告的附加内容以与由实体提供的信息一起显示在web页面上。因此,观看web页面的人可以访问作为web页面的主题的信息、以及可能与或可能不与web页面的主题相关的所选择的第三方广告。



技术实现要素:

本公开大体涉及基于已链接的计算设备来选择内容项。实体可以使用多个桌面设备或移动设备来访问网络,这可能导致跨多个设备分担实体的网络活动。然而,数据处理系统基于仅与设备相关联的部分网络活动来选择内容以用于在实体的该设备上显示可能是具有挑战性的。本文描述的系统和方法可以使用匿名标识符来链接两个或更多个计算设备。本文描述的系统和方法可以确定指示两个设备是否或是否应当被链接在一起的概率,并且当概率满足阈值时可以生成该链接。

至少一个方面涉及一种基于计算机网络活动来将计算设备彼此关联以用于选择作为在线内容项投放宣传活动(campaign)的一部分的内容项的方法。该方法可以包括数据处理系统基于在第一时间段期间经由第一ip地址的在第一计算设备和计算机网络之间的连接,并且基于在该第一时间段期间经由第一ip地址的在第二计算设备和计算机网络之间的连接,识别第一链接因子。该方法可以包括所述数据处理系统确定在第一时间段期间经由第一ip地址与所述计算机网络连接的、除了第一计算设备之外的计算设备的数目。该方法可以包括所述数据处理系统基于第一链接因子并基于计算设备的数目来生成正(positve)匹配概率。该方法可以包括所述数据处理系统基于在第二时间段期间在第一计算设备处的输入活动,并且基于在第二时间段期间在第二计算设备处的输入活动,监视第二链接因子。该方法可以包括所述数据处理系统基于在第三时间段期间经由第一ip地址的在第三计算设备处的活动,并且基于在第三时间段期间经由第二ip地址的在第二计算设备处的活动,监视第三链接因子。该方法可以包括所述数据处理系统基于第二链接因子并基于第三链接因子来确定负(negative)匹配概率。该方法可以包括所述数据处理系统基于正匹配概率和负匹配概率来将第一计算设备与第二计算设备链接。该方法可以包括所述数据处理系统创建数据结构以指示第一计算设备和第二计算设备之间的链接。

至少一个方面涉及用于基于计算机网络活动将计算设备彼此关联的系统。该系统可以包括具有一个或多个处理器的数据处理系统。该系统可以包括由数据处理系统执行的匹配引擎和连接器。匹配引擎可以基于在第一时间段期间经由第一网络节点标识符的在第一计算设备和计算机网络之间的连接,并且基于在第一时间段期间经由第一网络节点标识符的在第二计算设备和所述计算机网络之间的连接,识别第一链接因子。匹配引擎可以确定在第一时间段期间经由第一网络节点标识符与所述计算机网络连接的、除了第一计算设备之外的计算设备的数目。匹配引擎可以基于第一链接因子并基于计算设备的数目来生成正匹配概率。匹配引擎可以基于在第二时间段期间的在第一计算设备处的输入活动,并且基于在第二时间段期间的在第二计算设备处的输入活动,监视第二链接因子。匹配引擎可以基于在第三时间段期间经由第一网络节点标识符的在第一计算设备处的活动,并且基于在第三时间段期间经由第二网络节点标识符的在第二计算设备处的活动,监视第三链接因子。匹配引擎可以基于第二链接因子并基于第三链接因子来确定负匹配概率。连接器可以基于正匹配概率和负匹配概率来将第一计算设备与第二计算设备链接。

至少一个方面涉及基于计算机网络活动将计算设备彼此关联的方法。该方法可以包括数据处理系统基于在第一时间段期间经由第一网络节点标识符的在第一计算设备和计算机网络之间的连接,并且基于在第一时间段期间经由第一网络节点标识符的在第二计算设备与所述计算机网络之间的连接,识别第一链接因子。该方法可以包括所述数据处理系统确定在第一时间段期间经由第一网络节点标识符与所述计算机网络连接的、除了第一计算设备之外的计算设备的数目。该方法可以包括所述数据处理系统基于在第二时间段期间在第一计算设备处的输入活动,以及基于在第二时间段期间在第二计算设备处的输入活动,监视第二链接因子。该方法可以包括所述数据处理系统基于在第三时间段期间经由第一网络节点标识符的在第一计算设备处的活动,并且基于在第三时间段期间经由第二网络节点标识符的在第二计算设备处的活动,监视第三链接因子。该方法可以包括所述数据处理系统基于第一链接因子、第二链接因子、和第三链接因子来将第一计算设备与第二计算设备链接。

附图说明

本说明书中描述的主题的一个或多个实施方式的细节在附图和下面的描述中阐述。通过说明书、附图和权利要求书,主题的其它特征、方面和优点将变得显而易见。

图1描绘了根据实施方式的、用以基于经由计算机网络的已链接的计算设备来选择内容的系统。

图2描绘了根据实施方式的、基于经由计算机网络的已链接的计算设备来选择内容的方法。

图3a是根据实施方式的、来自多个计算设备的计算机网络活动的图。

图3b是根据实施方式的、来自多个计算设备的计算机网络活动的图。

图4是根据实施方式的、图示可以用于实现图1所示的系统的各个元件和图2所示的方法等的计算机系统的一般架构的框图。

各附图中相似的附图标记和名称指示相似的元件。

具体实施方式

本文描述的系统和方法一般涉及基于两个或更多个计算设备之间的链接来选择内容(例如,诸如电子文档或在线电子广告的内容项)。实体可以使用诸如桌面设备或移动设备的多个设备来访问诸如互联网的网络。例如,实体可以使用在第一工作地点的第一桌面型计算机、在第二工作地点的第二桌面型计算机、移动电话和笔记本计算机。因此,实体的网络活动可以跨多个设备分担。当网络活动跨多个设备分担时,对内容选择计算机网络基础架构中的内容选择计算机系统,选择用于在第一桌面型计算机上显示的内容可能是具有挑战性的,因为相对于与第二桌面型计算机、移动电话、和笔记本计算机中的一个或多个相关联的网络活动信息,内容选择系统可以访问仅与第一桌面型计算机相关联的有限的网络活动信息。

本文描述的系统和方法可以在不使用个人识别信息的情况下基于匿名id将多个计算设备彼此链接。本文描述的系统和方法可以包括数据处理系统,其确定指示两个计算设备之间的链接或非链接的总体匹配概率,其中链接可以指示公共所有者、操作者、用户或其它实体。数据处理系统可以基于每个计算设备的正匹配概率,负匹配概率、和加权因子的确定来确定两个计算设备之间的总体匹配概率。

正匹配概率可以指示两个计算设备由公共所有者、操作者、或用户链接的概率。例如,适于链接的两个计算设备可以在一天中的某时刻处于相同的地理位置或共享相同的互联网协议(“ip”)地址。相同的地理位置或共享的ip地址可以指示两个计算设备都从公共节点连接到诸如互联网的网络;例如,诸如在办公室环境中。当计算设备中的一个是诸如移动电话的移动计算设备时,数据处理系统可以基于例如公共所有者、操作者、或者用户将仅具有一个移动计算设备的假定,将该移动计算设备识别为所链接的计算设备的单个标识符。当数据处理系统在该ip地址处识别出除了该移动计算设备之外的多于一个的计算设备时,数据处理系统可以将正匹配概率设置为100%/n,其中n是由数据处理系统在第一ip地址处识别的除了该移动计算设备之外还有的计算设备的数目。

负匹配概率可以指示两个计算设备不由公共所有者、操作者、或用户链接的概率。例如,不适于链接的两个计算设备可以在分离大的物理距离——诸如数英里时均表现出活动。可以从两个计算设备的相应ip地址来识别或确定这样的分离。因此,当在两个计算设备彼此远离时从它们识别到同时的活动时,数据处理系统可以增加在这两个计算设备之间的负匹配概率。

在负匹配概率的另一示例中,不适合于链接的两个计算设备可以均表现出同时的高级别活动。高级别活动可能意指主动输入活动,与被动网络连接或活动相反。例如,单个所有者、操作者或用户可能不会同时在两个计算设备上播放视频游戏。然而,单个所有者、操作者、或用户可以在一个计算设备上流送视频,同时经由鼠标、键盘、或触摸屏向另一个计算设备提供输入。这样的主动输入可以被视为高级别的活动,而流媒体视频的被动消费可以不被视为高级别的活动。因此,由于在这个示例中公共用户不太可能会主动同时向多个计算设备提供输入,因此当识别到在两个计算设备上的同时的高级别活动时,数据处理系统可以增加那两个计算设备之间的负匹配概率。

数据处理系统可以基于对每个计算设备的正匹配概率、负匹配概率、和加权因子的确定,来确定两个计算设备之间的总体匹配概率。数据处理系统可以通过使用计算设备之间的确定的链接和确定的非链接进行训练,来确定正匹配概率的权重和负匹配概率的权重。例如,数据处理系统可以基于1/(1+e^-(wp*op+wn*on))形式的公式来确定总体匹配概率,其中wp=正匹配概率的权重,wn=负匹配概率的权重,op=正匹配概率,on=负匹配概率;*表示乘法或点积或其它数学组合。当总体匹配概率超过阈值时,数据处理系统可以确定两个计算设备被链接,或者当总体匹配概率低于或超过相同或不同的阈值时,确定两个计算设备没有被链接。

图1图示了用于基于经由计算机网络的链接的计算设备来选择内容的示例系统100。系统100可以包括内容选择基础架构。系统100可以包括经由网络105与内容提供者125、内容发布者115或计算设备110a-n(也称为计算设备110)中的一个或多个通信的数据处理系统120。网络105可以包括计算机网络——诸如互联网、局域网、广域网、城域网、或其它区域网络、内联网、卫星网络、以及诸如语音或数据移动电话网络的其它通信网络。网络105可以用于访问诸如web页面、web站点、域名或统一资源定位符的信息资源,其可以显示在至少一个计算设备110上,诸如膝上型计算机、桌面型计算机、平板计算机、个人数字助理、智能电话、或便携式计算机。例如,经由网络105,计算设备110的用户可以访问由至少一个web站点操作者或内容发布者115提供的web页面。在该示例中,计算设备110的web浏览器可以访问web站点操作者或内容发布者115的web服务器,以检索用于在计算设备110的监视器上显示的web页面。web站点操作者或内容发布者115通常包括操作web页面的实体。在一个实施方式中,web站点操作者或内容发布者115包括至少一个web页面服务器,其与网络105进行通信,以使web页面对计算设备110可用。

网络105可以是任何类型或形式的网络,并且可以包括以下中的的任何项:点对点网络、广播网络、广域网、局域网、电信网络、数据通信网络、计算机网络、atm(异步传输模式)网络、sonet(同步光网络)网络、sdh(同步数字体系)网络、无线网络、和有线网络。网络105可以包括诸如红外线信道或卫星频带的无线链路。网络105的拓扑结构可以包括总线网络拓扑、星形网络拓扑、或环形网络拓扑。网络可以包括使用用于在移动设备之间通信的任何一个或多个协议的移动电话网络,包括高级移动电话协议(“amps”)、时分多址(“tdma”)、码分多址(“cdma”)、全球移动通信系统(“gsm”)、通用分组无线电业务(“gprs”)、或通用移动通信系统(“umts”)。可以经由不同的协议传送不同类型的数据,或者可以经由不同的协议传送相同类型的数据。

系统100可以包括至少一个数据处理系统120。数据处理系统120可以包括至少一个逻辑设备——诸如具有处理器的计算设备——以经由网络105与例如计算设备110、web站点操作者或内容发布者计算设备115、以及至少一个内容提供者计算设备125通信。数据处理系统120可以包括至少一个服务器。例如,数据处理系统120可以包括位于至少一个数据中心中的多个服务器。数据处理系统120可以包括多个逻辑分组的服务器并且促进分布式计算技术。服务器的逻辑组可以称为服务器群或机器群。服务器也可以在地理上分散。机器群可以作为单个实体来管理,或者机器群可以包括多个机器群。每个机器群中的服务器可以是异构的——服务器或机器中的一个或多个可以根据一种或多种类型的操作系统平台来操作。

机器群中的服务器可以相关联的存储系统一起存储在高密度机架系统中,并位于企业数据中心中。例如,以这种方式整合服务器可以通过将服务器和高性能存储系统定位在本地化高性能网络上来提高系统可管理性、数据安全性、系统的物理安全性、和系统性能。集中服务器和存储系统并将其与高级系统管理工具耦合允许更有效率地使用服务器资源。

数据处理系统120可以包括具有至少一个服务器的内容投放系统。数据处理系统120还可以包括至少一个匹配引擎130、至少一个连接器135、至少一个内容选择器140、至少一个地理位置模块150、和至少一个数据储存库145。匹配引擎130、连接器135和内容选择器140均可以包括至少一个处理单元或诸如可编程逻辑阵列引擎的其它逻辑设备、或被配置为与数据库储存库或数据库145通信的模块。匹配引擎130、连接器135、内容选择器140、地理位置模块150、和数据储存库145可以是分离的组件、单个组件、或数据处理系统120的一部分。系统100及其组件——诸如数据处理系统——可以包括硬件元件,诸如一个或多个处理器、逻辑器件或电路。

数据处理系统120可以获得与多个计算设备110相关联的匿名计算机网络活动信息。计算设备110的用户可以肯定地授权数据处理系统120以获得与用户的计算设备110相对应的网络活动信息。例如,数据处理系统120可以提示计算设备110的用户以用于同意获得一个或多个类型的网络活动信息,诸如地理位置信息。计算设备110的用户的身份可以维持匿名,并且计算设备110可以与唯一标识符相关联(例如,由数据处理系统或计算设备的用户提供的用户或计算设备的唯一标识符)。数据处理系统可以将每个观察与对应的唯一标识符相关联。

对于这里讨论的系统收集关于用户的个人信息或可以利用个人信息的情境,可以向用户提供机会以控制程序或特征是否可以收集个人信息(例如,与用户的社交网络、社交行为或活动、用户的偏好、或用户的当前位置有关的信息),或控制是否和/或怎样从内容服务器接收可能与用户更相关的内容。另外,某些数据可以在被存储或被使用前以一种或多种方式处理,使得当生成参数(例如,人口统计参数)时关于该用户的某些信息被去除。例如,用户的身份可以被处理,使得无法确定该用户的识别信息,或在获取地理信息的情况下用户的地理位置可以被一般化(诸如,到城市、zip码或州级别),使得无法确定用户的具体位置。因此,用户可以对与用户有关的信息怎样被内容服务器收集和使用具有控制。

数据处理系统120可以接收对内容的请求。该请求可以包括查询,诸如输入到数据处理系统或其它系统的搜索引擎130中的搜索查询。输入的查询可以包括文本、字符、符号等。数据处理系统120可以经由网络105从计算设备110接收输入的查询。输入的查询可以包括音频(例如,由计算设备110的用户说出并经由网络105和接口输入到数据处理系统的搜索引擎的词语)。该请求可以包括或者关联于促进响应于该请求选择内容的信息。该信息可以包括例如关于要在其上显示所选择的内容的电子文档、web页面、电子应用、或有机非广告链接的场境信息(contextualinformation)。数据处理系统120可以提供显示输入文本框、按钮、下拉菜单或其它小部件(widget)的界面,客户端的用户可以通过其来选择或以其它方式指示搜索的类别。

响应于对内容(例如,电子广告)的搜索查询或其它请求,数据处理系统120(例如,经由内容选择器140)可以识别、选择或以其它方式获得待经由做出请求的计算设备110或与对于内容的请求相关联的一些其它计算设备110提供或呈现的内容。在一些实施方式中,数据处理系统120可以在没有接收对内容的请求的情况下识别、选择、或以其它方式获得内容。内容可以包括例如文本、字符、符号、图像、视频、音频或多媒体内容。内容项可以包括以赞助链接(例如,由内容提供者提供)的形式的广告,其由搜索引擎(例如,经由内容选择器)包括以用于在搜索引擎结果页面中显示。对内容的请求可以包括对于在线广告、文章、促销、优惠券、或产品描述的请求。数据处理系统120可以从诸如计算设备110的计算设备接收请求。例如,数据处理系统120可以经由在计算设备110上执行的应用——诸如在移动设备(例如智能电话或平板计算机)上执行的移动应用——来接收请求。在一些情况下,数据处理系统120可以不接收单独的对内容的请求,并且作为替代响应于搜索查询或与搜索结果一起来选择和提供内容(例如,广告)。在一些实例中,web页面可以响应于移动设备110的用户访问web页面(例如,经由移动设备110)来从数据处理系统120请求内容。

对于内容的请求可以包括促进内容选择的信息。例如,数据处理系统120可以从计算设备110请求信息以促进识别内容或内容选择。数据处理系统120可以响应于从计算设备110接收到对内容的请求而请求或获得信息。该信息可以包括关于在计算设备110上显示内容的信息(例如,内容位大小或位置)或关于显示或以其它方式操纵内容的计算设备110的可用资源的信息。

数据处理系统120可以识别响应于对内容的请求、或者以其它方式作为候选项的多个内容项(例如,第一候选内容项和第二候选内容项),以用于在在线文档(例如,web页面或在线市场的页面)上显示。数据处理系统可以发起或利用在线竞拍过程来选择多个内容项中的一个或多个内容项以用于在在线文档上显示。竞拍系统可以确定要在在线文档中显示的内容项的两个或更多个竞价。竞拍系统可以通过竞拍过程来运行竞价,以确定一个或多个胜出竞价。可以选择与胜出竞价或最高排名竞价相对应的内容项来显示在线文档上或与在线文档一起显示。

数据处理系统120可以包括内容选择器140。内容选择器140可以分析、解析或以其它方式处理web页面或候选内容项的主题,以确定候选内容项的主题是否与web页面相对应。内容选择器140可以使用图像处理技术、字符识别技术或数据库查找来识别、分析或辨识web页面或候选内容项的词项、字符、文本、符号或图像。候选内容项可以包括指示候选内容项的主题的元数据,在这种情况下,内容选择器140可以处理元数据以确定候选内容项的主题是否与web页面相对应。

内容提供者可以在设定包含内容项的内容宣传活动时提供附加指示符。内容提供者可以提供内容宣传活动或内容群组层级的信息,内容选择器140可以通过使用关于候选内容项的信息执行查找来识别该信息。例如,候选内容项可以包括可以映射到内容群组、内容宣传活动或内容提供者的唯一标识符。内容选择器140可以基于存储在数据储存库145中的关于内容提供者(例如,广告主)的信息来确定候选内容项与以下相关或匹配:对内容项的请求、经由内容项待与其一起显示的web页面提供的主题、或由计算设备输入的搜索查询。

数据处理系统120可以使用各种技术来选择内容。例如,数据处理系统120可以从来自合作伙伴内容选择网络的推介或商机(lead)中选择内容。在一些实施方式中,可以不使用关键字或匹配技术来选择内容,而是基于推介或商机来选择内容。

内容选择器140可以基于例如与发起对内容项的请求的计算设备110或者将要显示内容项的计算设备110相关联的网络活动信息、浏览历史信息、简档信息等来选择内容项。内容选择器140可以识别在要显示内容项的第一计算设备110和第二计算设备110之间的链接,并且使用与第一计算设备和第二计算设备110两者相关联的网络活动信息、浏览历史、或其它简档信息来选择用于显示的内容项。例如,第一计算设备可能已经访问了正运行的博客web页面,并且第二计算设备可能已经访问了销售由公司a制造的跑步鞋的在线零售商的web页面。使用在第一计算设备和第二计算设备之间的链接,内容选择器可以基于第二计算设备的网络活动信息或浏览历史,选择响应于来自第一计算设备的请求、并且用于在第一计算设备上显示的内容项。例如,即使第一计算设备没有访问具有跑步鞋的web页面,内容选择器140也可以为由公司a制造的跑鞋选择用于在第一计算设备上显示的广告。因此,内容选择器140可以使用链接来选择更相关的内容项以用于显示,这可以改善内容选择器提供更相关的内容项的能力,从而改善内容选择基础架构、用户体验和内容提供者的广告度量。

数据处理系统120可以包括设计和构造来确定是否要链接两个或更多个计算设备110a-n的匹配引擎135。可以设计和构造匹配引擎135以识别至少两个计算设备110a-n之间的链接因子,确定正匹配概率或负匹配概率,并且基于正匹配概率和负匹配概率来在该至少两个计算设备之间生成链接。两个计算设备之间的链接可被用于提供或选择内容项以作为在线内容项投放宣传活动的一部分。

以下描述了确定和生成用于将计算设备彼此关联的两个计算设备之间的链接的各个技术实施方式。

为了生成两个计算设备之间的链接,匹配引擎130可以识别第一链接因子。匹配引擎130可以基于由第一计算设备110a和第二计算设备110b用来经由网络连接访问网络105的互联网协议(“ip”)地址来识别链接因子。在一些实施方式中,匹配引擎130可以基于与网络节点155(例如无线或有线路由器、网络网关、防火墙设备、网络交换机、移动热点等)相关联的标识符(例如,ip地址、mac地址、wifi地址,诸如源端口、目的地端口的tcp/ip报头信息)来识别第一链接因子。

链接因子可以指代匹配引擎130可用来确定正匹配概率或负匹配概率的因子。链接因子可以存储在数据储存库145中的链接数据结构中。链接因子可以包括二进制值(例如,0或1、是或否、正或负、标志(flag)或无标志)、指示链接因子的级别或程度的数值得分(例如,0至1、1至10、1至100)、字母数字值、词项、短语等。例如,匹配引擎130可以基于满足链接因子的条件、规则或事件来确定可能存在链接因子(例如,“1”、标志、“是”)。例如,链接因子的事件、条件、触发器或规则可以包括或基于以下中的一个或多个:(1)识别到在第一时间段期间经由第一ip地址(或节点155的其它标识符)在第一计算设备110a和网络105之间的连接,且识别到在第一时间段期间经由第一ip地址在第二计算设备110b和网络105之间的连接;(2)在第二时间段期间在第一计算设备110a处的输入活动和在第二时间段期间在第二计算设备110b处的输入活动;(3)在第三时间段期间经由第一ip地址在第一计算设备110a处的活动以及在第三时间段期间经由第二ip地址在第二计算设备110b处的活动;(4)第一计算设备110a和第二计算设备110b之间的地理距离,以及在某个时间段期间经由第一ip地址在第一计算设备110a处的输入活动,以及经由第二ip地址在第二计算设备110b处的输入活动。

例如,数据处理系统120可以从第一计算设备110a接收网络活动信息。网络活动可以包括例如:计算设备110a访问由数据处理系统120提供的web页面,数据处理系统120接收对来自计算设备110a的或用于在计算设备110a上显示的内容的请求,在计算设备110a上执行的应用通信、ping、轮询或以其它方式访问数据处理系统120或与数据处理系统120进行交互以获取信息。当计算设备110a向数据处理系统110发送请求或以其它方式与数据处理系统110连接或交互时,交互可以包括识别连接的电子返回地址或ip地址的数据分组。网络活动信息可以包括识别与网络活动信息相关联的节点155或ip地址的信息。例如,数据处理系统120可以接收包括具有源ip信息的报头的网络数据分组。在一些实施方式中,数据处理系统120可以向计算设备110发送请求以识别链接到该网络活动的ip地址。

数据处理系统120可以将节点标识符(例如,ip信息)存储在存储器或链接数据结构中。在一些实施方式中,数据处理系统120可以不存储该信息。在一些实施方式中,数据处理系统120可以以临时性的方式(例如,1小时、30分钟、5分钟、60秒、24小时等)来存储该信息。数据处理系统120可以从第二计算设备110a接收网络活动信息,解析网络数据分组(例如,报头信息或有效载荷信息)以确定与该网络活动相关联的第二ip地址,并将该信息存储在链接数据结构或其它数据库或数据记录中。数据处理系统120可以使用该ip地址(或其它节点155标识符)在链接数据结构中执行查找,以识别经由该ip地址连接或使用网络105的计算设备的数目。在一些实施方式中,数据处理系统可以将第二ip地址与第一ip地址(或其它节点155标识符)进行比较,以确定ip地址是否匹配。响应于与来自这两个计算设备110a-b的网络活动信息相关联的ip地址或其它节点155标识符匹配,数据处理系统120可以识别链接因子。在一些实施方式中,链接数据结构可以存储活跃的网络活动连接,或者包括指示网络活动连接何时处于活跃或非活跃的时间戳。

数据处理系统120(例如,经由匹配引擎130)可以确定或识别在其期间经由第一ip地址的在第一计算设备和计算机网络之间的连接打开的第一时间段。匹配引擎130还可以确定或识别在其期间经由第一ip地址的在第二计算设备和计算机网络之间的连接打开的第二时间段。匹配引擎130可以基于第一时间段和第二时间段是否是重叠的时间段来确定链接因子。例如,数据处理系统120可以存储与第一计算设备和第二计算设备相关联的网络活动会话的时间戳。该时间戳可以指示网络活动会话的开始和停止时间。时间戳可以进一步与网络活动级别相关联。网络活动级别可以指示使用的带宽量、上传或下载的数据量、网络活动的类型(例如,web浏览、电子邮件、视频流送或下载、音乐流送或下载、使用该连接的应用的名称或类型、使用了该连接的端口等)。数据处理系统120可以将该信息存储在针对第一计算设备的链接数据结构中。在一些实施方式中,数据处理系统120可以响应于对内容项的请求而确定或识别该信息。

在一些实施方式中,匹配引擎130可以识别或确定做出该连接的计算设备的类型。例如,计算设备的类型可以包括移动设备、移动电信设备、桌面型计算机、膝上型计算机、平板计算机、智能电话、电子书阅读器、智能手表、可穿戴计算设备、游戏设备、电视机顶盒、数字媒体播放器、微控制台。例如,计算设备的类型还可以指示操作系统、可用资源、设备信息等。

数据处理系统120(例如经由匹配引擎130)可以比较与第一计算设备110a和第二计算设备110b相关联的网络活动的时间戳,以确定网络活动是否重叠。例如,匹配引擎130可以从数据储存库145中的链接数据结构检索第一计算设备和第二计算设备的网络活动的开始和停止时间,以确定网络活动会话是否重叠。在一些实施方式中,匹配引擎130可以实时地确定使用相同ip地址或节点访问网络105的两个计算设备的网络活动会话是否重叠。实时可以指代在连接期间、在连接的重叠部分期间、在一个连接或两个连接均终止时、或响应于对内容的请求而做出确定。

在一些实施方式中,匹配引擎130可以基于两个计算设备之间的地理距离来确定链接因子,其中两个计算设备经由与两个不同ip地址相关联的两个不同连接来访问网络。例如,如果两个计算设备先前经由与相同节点155或ip地址相关联的两个连接来访问网络,具有重叠的网络活动,则匹配引擎130可以确定该两个计算设备具有第一正匹配概率。然而,如果这两个计算设备中的一个位于不同的地理位置,则匹配引擎130可以确定低于第一正匹配概率的第二正匹配概率。这可以是因为匹配引擎130确定单个实体(例如,用户)可能不会同时使用位于不同地理位置的两个计算设备。

数据处理系统120可以包括设计和构造为接收与一个或多个计算设备110a-n相关联的地理位置数据点的地理位置模块130。数据处理系统可以经由tcp/ip协议、蜂窝电话数据网络或计算机网络105的另一通信协议来经由计算机网络105接收数据点。数据点可以包括位置信息和时间信息,或数据处理系统120可以在从用户设备110接收数据点时确定与接收到的数据点相关联的位置或时间信息。数据处理系统120还可以接收与数据点相关联的标识符,诸如唯一用户设备标识符、或与正在用户设备110上执行的应用相关联的用户名。在一个实施方式中,正在用户设备110上执行的应用(例如,移动应用、移动操作系统、web浏览器、地图应用等)可以传送包括该位置信息的地理位置数据点。在一个实施方式中,移动用户设备110可以周期性地ping数据处理系统120或其它中间系统,以提供位置或时间信息。在一个实施方式中,智能电话或其它支持蜂窝的用户设备110可以ping蜂窝电话塔系统,然后其可以向数据处理系统120提供位置或时间信息。

数据处理系统120可以实时地、或者以诸如周期性方式的预定时间间隔(例如,10分钟、5分钟、1分钟、30秒、或者可以促进此处公开的系统和方法另一周期)接收地理位置数据点或ping。在另一个实施方式中,数据处理系统120可以在周期性运行的批处理过程中接收数据点,其中与用户设备110或多个用户设备110相关联的多个地理位置数据点可以在单个上传过程中被提供给数据处理系统120。在一个实施方式中,用户设备110将数据点实时地、以周期性的方式、或在批处理过程中推送到数据处理系统120。在一个实施方式中,点击了内容项的用户设备110与提供数据点的用户设备110不同(例如,用户可以使用桌面型或膝上型计算机点击内容项,并使用移动设备或智能电话提供数据点)。在另一实施方式中,用于点击内容项的用户设备110与用于生成、提供或传送数据点的用户设备110相同。

数据点可以包括地理位置数据点的地理位置信息,或者数据处理系统120可以基于例如gps、wi-fi、ip地址、蓝牙或小区塔三角测量技术来确定地理位置数据点的地理位置信息。在一些实施方式中,数据处理系统120可以确定纬度和经度坐标,并且识别包括纬度和经度坐标的较大地理区域或小区。地理位置可以对应于纬度或经度坐标,或者地理位置可以对应于例如更大或更小的区域。

在一些实施方式中,所接收的数据点可以包括地理位置信息,或者数据处理120可以确定地理位置信息,该地理位置信息包括例如纬度和经度坐标、地理信息系统(“gis”)信息、国家、州、城市、县、镇、或区(precint)。数据处理系统120可以经由应用编程接口(“api”)接收或以其它方式识别与用户设备110相关联的地理位置信息,该api可以提供对与用户设备110相关联的地理位置信息的脚本化访问。例如,地理api规范可以包括与万维网联盟(“w3c”)相关联的规范。在一个实施方式中,用户设备110的用户通过登入到位置或以其它方式向在用户设备110上执行的应用或向数据处理系统声明用户处于位置,来主动声明位置。

在一些实施方式中,可以经由全球定位系统(“gps”)、小区塔三角测量或wi-fi热点中的至少一个,利用适当的最终用户同意来确定用户设备110的地理位置。例如,数据处理系统120可以识别或确定用于确定地理位置的技术,以确定所确定的地理位置数据点的准确度(例如,基于gps的位置信息可能比基于ip的位置信息更准确)。数据处理系统120还可以基于用户与信息资源的交互来确定地理位置信息。在一些实施方式中,用户设备110可以包括全球定位系统(“gps”)。在一些实施方式中,数据处理系统120可以基于互联网协议(“ip”)地址来确定地理位置。例如,用户设备110可以包括gps传感器或天线,并且被配置为确定用户设备110的gps位置。数据处理系统120还可以通过使用从一个或多个小区塔获得的信息三角测量用户设备110的位置来确定地理位置。例如,基于从一个小区塔、两个小区塔或三个小区塔接收的一个信息确定的地理位置可能足以用于内容选择。在一些实施方式中,wi-fi热点可以促进确定地理位置,因为wi-fi热点可以是静止的,并且可以用作地标。例如,用户设备110相对于wi-fi热点的关系可以促进确定用户设备110的地理位置。

数据处理系统120(例如,经由匹配引擎130)可以确定在一时间段期间经由节点155(例如,经由第一ip地址)来与网络150连接的计算设备110a-n的数目。数据处理系统120可以确定除第一计算设备110a之外的计算设备110a-n的数目。例如,第一计算设备110a可以是促进确定链接因子的移动计算设备110a。数据处理系统120可以使用移动计算设备110a作为用于已链接计算的单个标识符或用于识别链接因子的参考,以促进确定正匹配因子或负匹配因子。

数据处理系统120可以使用匿名标识符来确定已链接的计算设备或参考移动设备的单个标识符。匿名标识符对移动设备可以是唯一的。数据处理系统120可以确定或生成匿名标识符。例如,数据处理系统120可以基于包括例如ip、操作系统、应用信息、设备信息的、与移动设备相关联的信息来生成匿名标识符。操作系统可以指代操作系统的类型。应用信息可以指代安装在移动设备上的应用的配置、安装在移动设备上的应用的名称、与一个或多个应用相关联的标识符、应用的使用模式等。匿名或伪匿名标识符可以是数值、字母数值,包括字符、符号等。例如,数据处理系统可以确定ip地址、操作系统和前三个最常用的非本地应用以生成移动设备的标识符。数据处理系统120可以使用该第一计算设备的匿名标识符(或伪匿名标识符)作为已链接的第一计算设备和第二计算设备的标识符。例如,数据处理系统120可以将链接数据结构中的标识符与两个计算设备之间的链接相关联。

为了确定使用相同的ip地址或节点155标识符来与网络105连接的计算设备的数目,数据处理系统120可以使用该ip地址或节点155标识符在数据结构中执行查找。查找的结果可以指示经由该ip地址连接的计算设备的数目。由于这些设备中的一个可以包括所述第一计算设备或所述移动设备,所以数据处理系统120可以从查找结果中减去数目1来确定经由ip地址连接到网络105的其它计算设备的数目。

数据处理系统120(例如,经由匹配引擎)可以基于第一链接因子并基于计算设备的数目来生成正匹配概率。初始正匹配概率可以被设定为缺省正匹配概率。缺省正匹配概率可以是诸如0或1的值,或诸如0%或预定的其它缺省值(例如,100、10、50等)的百分比。数据处理系统120可以增加缺省的正匹配概率或者确定新的正匹配概率。在一些实施方式中,数据处理系统120被配置为基于以下公式来确定正匹配概率:100%/n,其中n是由数据处理系统识别的、在第一时间段期间在第一ip地址的除了第一计算设备之外的计算设备的数目。公式中的分子可以是预定数目或百分比或其它值。在某些情况下,分子可以包括50%、75%、25%等。

该匹配引擎130可以基于各种因子或链接因子来增加正匹配概率。数据处理系统120可以监视与计算设备相关联的活动以作出关于关联因子的确定。例如,数据处理系统120可以识别来自第一计算设备的与在第四时间段在第二计算设备处的活动的中止相对应的活动。第四时间段可以是与第一、第二、或第三时间段不同的时间段(例如,重叠或彼此排斥的)或相同时间段。数据处理系统120可以监视来自第二计算设备110b的活动并确定活动的中止或终止或结束(例如,第二计算设备110b关闭、进入待机模式,在第二计算设备110b上执行的应用终止、退出、或关闭,网卡被关闭或禁用,对网络105的访问丢失等)。数据处理系统120可以确定响应于不再从第二计算设备110b接收网络活动的中止、或者网络活动的中止的另一指示(例如,对注销或禁用或终止连接的请求)。

此外,数据处理系统120可以监视来自第一计算设备110a的活动,以确定来自第一计算设备110a的活动的发起对应于来自第二计算设备110b的活动的停止。例如,数据处理系统110a可以识别来自第一计算设备110a的活动,诸如经由网络105对web页面或其它内容的请求。数据处理系统120可以确定在该活动之前,第一计算设备110a不活跃。例如,数据处理系统120可能至少在某个时间间隔(例如,10分钟、5分钟、30分钟、1小时等)内未接收到来自计算设备110a的任何活动。因此,数据处理系统120可以识别来自第一计算设备110a的活动的发起并且识别与这样的发起相关联的时间戳,并将该发起时间戳和与第二计算设备110b相关联的中止时间戳进行比较,以确定来自第一计算设备110a的活动的发起对应于来自第二计算设备110b的活动的中止。例如,发起可以与中止并行、响应于中止、与中止连续、与中止重叠、或者在中止的时间间隔内。

数据处理系统120可以确定负匹配概率。数据处理系统120可以基于一个或多个链接因子来确定负匹配概率。例如,数据处理系统120可以使用以下链接因子来确定负匹配概率:在第二时间段期间在第一计算设备处的输入活动,并且其基于在第二时间段期间在第二计算设备处的输入活动;或在第三时间段期间经由第一ip地址在第一计算设备处的活动,并且其基于在第三时间段期间经由第二ip地址在第二计算设备处的活动。第一、第二和第三时间段中的一个或多个可以是不同的、重叠、或是相同的。

输入活动可以指代网络活动的级别或网络活动的类型。输入活动可以包括高级别输入活动或被动输入活动。高级别活动可以包括主动输入活动,诸如玩视频游戏、键入文字文档、使用计算机辅助设计程序、软件编程等。被动活动可以包括例如流送音乐、流送视频、屏幕保护程序、心跳或血压传感器、环境光传感器、gps传感器等。用户不太可能同时在两台计算设备上执行高级别的活动。例如,用户可能不会同时在两个不同的计算设备上玩视频游戏。因此,两个计算设备上的高级别活动可以与增加负匹配概率相对应。然而,用户可以在一个计算设备上聆听流送音乐,同时在另一个计算设备上玩视频游戏。因此,诸如流送音乐或流送视频或电影的被动活动可能不是高级别的活动,并且可能不会增加负匹配概率。

例如,数据处理系统120可以确定与第一链接因子不同的第二链接因子。第二链接因子可用于确定负匹配概率。第二链接因子可以基于与第一时间段不同的第二时间段(例如,重叠或彼此排斥)。第二链接因子可以基于用于确定第一链接因子的相同的第一计算设备110a(例如,移动设备110a)和相同的第二计算设备110b。在一些实施方式中,第一链接因子和第二链接因子基于相同的两个计算设备,并且第一链接因子基于第一时间段期间的连接,并且第二链接因子基于在第二时间段期间的输入活动。在第二时间段期间与第一计算设备和第二计算设备相关联的输入活动可以与也可以不与第一ip地址相关联。在第二时间段期间与第一和第二计算设备相关联的输入活动可以相同的ip地址相关联与也可以不与其相关联。

数据处理系统120可以监视附加的链接因子,诸如不同于第一链接因子和第二链接因子的第三链接因子。第三链接因子可以基于用于确定第一链接因子和第二链接因子的相同的第一计算设备和第二计算设备。第三链接因子可以基于第三时间段。第三时间段可以是与第一链接因子的第一时间段和第二链接因子的第二时间段相同的时间段。第三时间段可以不同于第一时间段或第二时间段(例如,重叠或彼此排斥)。第三链接因子可以基于在该时间段期间在第一计算设备和第二计算设备处的活动。第三链接因子可以基于在第一计算设备的活动与相对于第二计算设备的活动的不同ip地址相关联的时间段期间在第一计算设备和第二计算设备处的活动。例如,第一计算设备的活动可以与第一ip地址相关联,而第二计算设备的活动可以与不同于第一ip地址的第二ip地址相关联。

使用第二链接因子和第三链接因子,数据处理系统120(例如,经由匹配引擎130)可以确定负匹配概率。负匹配概率可以在链接数据结构中初始化为例如0、0%、1或某些其它缺省预定值的缺省负匹配概率。数据处理系统120可以响应于识别指示负匹配的链接因子来使负匹配概率增加一定量。指示负匹配的链接因子可以包括第二链接因子和第三链接因子。

负匹配概率可以增加固定量或预定量。例如,每当数据处理系统120识别出指示负链接的链接因子时,负匹配概率可以增加10%、25%、30%、50%、或一些其它量或百分比,这促进链接两个或更多设备来选择内容项。在一些情况下,数据处理系统120可以确定增加或减少负匹配概率的量。例如,链接因子(例如,第三链接因子)可以基于第一计算设备和第二计算设备之间的地理距离、基于在第三时间段期间经由第一ip地址在第一计算设备处的输入活动的指示、以及基于经由第二ip地址在第二计算设备处的输入活动的指示。数据处理系统120可以使用该距离来确定负匹配概率。例如,如果移动设备和第二计算设备之间的距离大于某个阈值,则数据处理系统120可以添加负链接。此外,数据处理系统120可以将负匹配概率确定为与距离和时间的指数比例。例如,如果距离为1英里,并且第一计算设备活动请求和第二计算设备活动之间的持续时间小于1分钟,则两个设备极不可能被同一个实体使用,因此不应当被链接。然而,如果在两个活动之间的持续时间是30分钟,则它们有可能被相同实体使用,并且因此可以被链接。因此,距离越高并且时间越短,则负匹配概率以指数方式增加。

该数据处理系统120可以包括设计和构造为基于正匹配概率和负匹配概率来链接两个计算设备的连接器135。数据处理系统120(例如,经由连接器135)可以创建数据结构(例如,数据储存库145中的链接数据结构)以指示第一计算设备110a和第二计算设备110b之间的链接。链接可以包括指示两个计算设备110a-b之间的公共匿名或伪匿名最终用户的关联、链接的标志、二进制值、指针、字母数字值、匿名标识符、或其它关联技术。

数据处理系统120可以链接第一计算设备和第二计算设备,并且基于总体匹配概率来在数据结构中创建链接。总体匹配概率可以虑及正匹配概率和负匹配概率。例如,数据处理系统120可以通过组合正匹配概率和负匹配概率来确定总体匹配概率。组合可以指代将它们相加(例如,如果正匹配是正数,负匹配是负数)或相减(例如,如果正和负匹配两者都是正值),或者使用公式来组合它们。例如,数据处理系统120可以基于正匹配概率(“op”)和负匹配概率(“on”)之间的差来确定总体匹配概率。例如,总体匹配概率=op-on或总体匹配概率=on-op。数据处理系统120可以将总体概率与阈值(例如,0%、25%、50%等)进行比较。当总体匹配概率满足阈值时,则数据处理系统120可以链接两个计算设备。满足阈值可以指代总体匹配概率等于或大于阈值。在某些情况下,满足阈值可以指代总体匹配概率小于阈值。例如,如果op=100%,on=25%,且阈值=25%,则总体概率可以是op-on=75%,其大于25%阈值。因此,数据处理系统120可以确定总体匹配概率满足阈值,响应于此数据处理系统120可以链接这两个计算设备并在链接数据结构中指示该链接。

数据处理系统120可以基于加权因子来确定链接第一计算设备和第二计算设备。例如,负匹配概率和正匹配概率可以具有对应的权重。可以基于机器学习模型或回归分析来确定权重。例如,数据处理系统120可以执行离线回归分析以确定调整op和on的权重如何影响预测两个设备是否实际上被相同实体使用的能力。

数据处理系统120可以配置有以下公式来确定总体匹配概率:1/(1+e^-(wp*op+wn*on)),其中wp=正匹配概率的权重,wn=权重对于负匹配概率,op=正匹配概率,on=负匹配概率。权重可以是大于零的数字。权重可以是预定的、由数据处理系统120的管理员设定、从链接数据结构获得等。可以为第一计算设备110a个性化或定制权重。数据处理系统120可以基于已知链接和已知非链接来校准正匹配概率的权重和负匹配概率的权重。数据处理系统120可以在数据储存库145中的链接数据结构中存储已知链接和非链接。数据处理系统120可以使用该信息来确定第一wp和第一wn导致生成假的链接(例如非链接)或导致低点进(clickthrough)率。然后,数据处理系统120可以调整权重并确定生成较少的错误链接或增加的点击率。如果使用历史数据,则数据处理系统120可以确定利用第二加权的预测的点进,并将使用调整后的加权的预测的点击率与实际的历史点击率进行比较。

数据处理系统120可以生成指示与计算设备相关联的网络活动信息的向量。活动向量可以基于可以包括ip地址、活动、和日内时间的数据点。活动向量可以基于包括ip地址、活动和日内时间的连续(例如,顺序的或时间顺序的)数据点。例如,对于每个计算设备,数据处理系统120可以生成指示在一天的不同部分期间计算设备的活动程度或级别的活动向量。如果两个计算设备在时隙或时间段期间具有相似的活动签名(例如,活动级别或活动类型),则两个计算设备可能不太可能属于相同用户。数据处理系统120可以进一步生成位置向量,以指示计算设备在时隙或时间段期间物理上所位于的位置。基于该位置向量,数据处理系统120可以确定如果在时隙或时间段期间两个计算设备之间的距离大于距离阈值(例如,5英里、1英里、10英里、30英里等),则两个计算设备属于相同用户、或者计算设备中的一个正由多个用户共享的概率很低。因此,基于在与第一计算设备相关联的第一活动向量与与第二计算设备相关联的第二活动向量之间的比较,数据处理系统120可以调整(例如,增加或减少)正匹配概率和负匹配概率。

数据处理系统120可以基于在一个或多个时间段期间的链接因子来生成两个计算设备之间的非链接(或空(null)、无效、或不存在链接,或去除链接,或者未链接的指示)。当两个计算设备在相同时间段期间具有高度的输入活动时,数据处理系统120可以确定不链接两个计算设备(或指示两个计算设备之间的非链接)。当两个计算设备在相同时间段期间均具有高度的输入活动并且它们是相同类型的输入活动时,数据处理系统120可以确定不链接两个计算设备(或指示在两个计算设备之间的非链接)。当两个计算设备在相同时间段期间均具有高度的输入活动,并且它们分离大于距离阈值(例如0.5英里)的距离时,数据处理系统120可以确定不链接两个计算设备(或指示在两个计算设备之间的非链接)。

例如,数据处理系统120可以基于在第四时间段期间在第三计算设备处的输入活动,并且基于在第四时间段期间在第四计算设备处的输入活动,来监视第三计算设备和第四计算设备的第四链接因子。例如,当第三计算设备和第四计算设备两者均具有输入活动或大于阈值(例如,对web页面或内容的请求的数目;正使用的带宽量;键盘、鼠标、触摸、或语音输入的量等)的输入活动的程度时,数据处理系统120可以确定存在第四链接因子。

然后,数据处理系统120可以识别与两个计算设备的活动相关联的ip地址的改变,以识别第五链接因子。例如,数据处理系统可以基于在第五时间段期间经由第三ip地址在第三计算设备处的活动,并且基于在第五时间段期间经由第四ip地址在第四计算设备处的活动,来监视第三计算设备和第四计算设备的第五链接因子。例如,数据处理系统120可以确定经由第三计算设备和第四计算设备两者发生的大于阈值的输入活动的级别或程度。数据处理系统120还可以确定经由第三计算设备和第四计算设备两者发生的大于阈值的输入活动的级别或程度与两个不同的ip地址相关联。例如,第三计算设备和第四计算设备可以在不同的地理位置由不同的用户使用。

基于第四链接因子和第五链接因子,数据处理系统120可以生成第二负匹配概率。数据处理系统120可以生成高的第二负匹配概率,因为存在经由两个计算设备但是来自不同位置的网络活动。然而,如果网络活动仅经由其中一个设备发生,则负匹配概率可能较低。类似地,如果网络活动发生在两个计算设备处但是经由相同的ip地址(例如,在相同的位置),则负匹配概率可能较低。数据处理系统可以基于第二负匹配概率来确定第三计算设备和第四计算设备之间的非链接。数据处理系统可以创建或修改链接数据结构以指示第三计算设备和第四计算设备之间的非链接。

数据处理系统120(例如,经由内容选择器140)可以基于该链接并基于第一计算设备的计算机网络活动来选择用于在第二计算设备上与在线文档一起投放的内容项。例如,如果第一计算设备和第二计算设备被链接,则数据处理系统120可以使用与第二计算设备相关联的信息(例如,浏览历史、网络活动信息),来响应于来自第一计算设备的对广告的请求,在第一计算设备上显示广告。

图2图示了根据实施方式的、用于基于经由计算机网络的已链接计算设备来选择内容的方法200。方法200可以基于计算机网络活动来促进将计算设备彼此关联。方法200可将计算设备关联在一起以供应或选择作为在线内容项投放宣传活动的一部分的内容项。方法200可以由系统100、数据处理系统120、计算设备400、或其一个或多个组件执行。在块210处,方法200可以包括数据处理系统识别第一链接因子。基于在第一时间段期间经由第一ip地址的第一计算设备和计算机网络之间的连接,并且基于在第一时间段期间经由第一ip地址的在第二计算设备和计算机网络之间的连接,数据处理系统可以识别第一链接因子。该连接可以包括经由计算机网络的网络连接。例如,第一计算设备和第二计算设备可以经由网络连接到数据处理系统。计算设备可以发起或建立连接。在某些情况下,数据处理系统可以发起或建立连接。响应于对用于在计算设备上显示的内容或web页面的请求,计算设备可以发起连接或者可以建立连接。计算设备可以响应于用户与计算设备的交互、用户输入、事件、或条件而发起连接。用户交互可以包括用户活动或输入活动。用户活动或输入活动可以包括例如由诸如gps传感器、运动传感器、陀螺仪、加速度计、环境光传感器、温度传感器、声音传感器、血压传感器等的计算设备的传感器感测的活动。

当在第一计算设备和数据处理系统之间存在连接,在第二计算设备和数据处理系统之间存在连接,并且两个连接均经由相同的ip地址或网络节点或网关标识符(例如,相同的无线或有线路由器、电缆调制解调器、桥接器、网卡等)做出时,数据处理系统可以识别第一链接因子。

方法200可以包括在块215处,数据处理系统确定与计算网络连接的计算设备的数目。数据处理系统可以确定在第一时间段期间经由第一ip地址的、与计算机网络连接的除了第一计算设备之外的计算设备的数目。例如,数据处理系统可以通过对使用相同ip地址连接的计算设备的数目进行计数,来确定经由第一ip地址连接到计算机网络的计算设备的数目。然后,数据处理系统可以确定这些计算设备之一是第一计算设备。第一计算设备可以是用于已链接的计算设备或参考设备或链接设备的单个标识符。第一计算设备可以是移动设备。第一计算设备可以与唯一标识符相关联。数据处理系统可以生成第一计算设备的唯一标识符。数据处理系统可以使用与第一计算设备相关联的特性、参数或其它信息来生成第一计算设备的唯一标识符。所述信息可以包括例如设备类型(例如,移动设备、平板计算机、膝上型计算机、桌面型计算机等)、操作系统(例如,移动操作系统、桌面操作系统、操作系统的制造者或提供者、操作系统的版本)、设备信息(例如,设备的制造者、设备的硬件规范、mac地址等)、应用信息(例如,与网络活动相关联的应用、应用配置、计算设备上的应用)、或与计算设备相关联的其它信息。使用这些特性的组合,数据处理系统可以为计算设备生成唯一标识符、匿名标识符、假名(pseudonymous)标识符。在将计算设备的标识符识别为与第一计算设备、移动设备、单个标识符、或参考/链接设备相对应时,所述数据处理系统可以确定经由所述ip地址连接的除了所述参考计算设备之外的设备的数目。

方法200可以包括在框220,数据处理系统生成正匹配概率。正匹配概率可以具有0%的初始值或缺省值。数据处理系统可以基于使用如框215所确定的第一ip地址来连接的计算设备的数目来生成正匹配概率。例如,正匹配概率可以是100%/n,其中n是除了在框215处确定的参考设备之外的计算设备的数目。数据处理系统可以基于链接因子来进一步向上或向下调整正匹配概率。

方法200可以包括在块225处,数据处理系统监视第二链接因子。第二链接因子可以基于来自块210、215和220的来自两个计算设备的在第二时间间隔的输入活动。第二时间间隔可以与第一时间间隔重叠。第二时间间隔可以与第一时间间隔相互排斥。第二时间间隔可以与第一时间间隔相同。输入活动可以包括用户输入、来自计算设备的传感器的输入、语音输入、键盘或鼠标输入、触摸屏输入、运动输入、手势输入、gps传感器输入等。

数据处理系统可以基于在第二时间段期间在第一计算设备处的输入活动以及基于在第二时间段期间在第二计算设备的输入活动来监视第二链接因子。如果两个计算设备均表现出同时的高级别活动,则第二链接因子可以指示负匹配概率或不适于链接的两个计算设备。高级别活动可以包括主动输入活动,诸如玩视频游戏、键入文字文档、计算机辅助设计程序、软件编程等。例如,用户可能不会同时在两个不同的计算设备上玩视频游戏。然而,用户可以在一个计算设备上聆听流送音乐,同时在另一个计算设备上玩视频游戏。因此,诸如流送音乐或流送视频或电影的被动活动可能不是高级别的活动。

方法200可以包括在框230处,数据处理系统监视第三链接因子。第三链接因子可以基于在第三时间段期间经由第一ip地址的在第一计算设备处的活动,并且基于在第三时间段期间经由第二ip地址的在第二计算设备处的活动。第三链接因子可以对应于负匹配概率。例如,不适于链接的两个计算设备可以在分离大物理距离的同时均表现出活动。可以根据两个计算设备的相应ip地址来识别或确定这样的分离。因此,当数据处理系统识别到当两个计算设备分离距离阈值(例如,0.5英里、1英里、5英里、10英里、30英里)时来自两个计算设备的同时活动时,可以增加这两个计算设备之间的负匹配概率。

方法200可以包括在框235处,数据处理系统确定负匹配概率。数据处理系统可以基于第二链接因子并基于第三链接因子来确定负匹配概率。例如,每当识别到第二链接因子或第三链接因子(在框225和230中的)时,数据处理系统可以增加负匹配概率。该增加可以是增加预定量,或者基于与第二链接因子和第三链接因子相关联的信息来计算。例如,参考第三链接因子,两个ip地址之间的距离越大,负匹配概率的增加越大。这种基于距离分离的增加可以是成比例的、指数比例的、加法的等。负匹配概率也可以基于可以虑及时间段的规则或公式来确定。例如,如果识别第一链接因子和第三链接因子之间的时间间隔小,并且在第三链接因子中的两个ip地址之间的距离大,则该两个计算设备更有可能由不同用户使用,由此指示较大的负匹配概率。

方法200可以包括在框240处,数据处理系统链接第一计算设备与第二计算设备,并且在框245处,在存储器或数据库中创建数据结构以指示链接。系统可以将正匹配概率和负匹配概率组合,并将总体概率与概率阈值进行比较以确定是否链接设备。数据处理系统使用以下公式来确定总体匹配概率:1/(1+e^-(wp*op+wn*on)),其中wp=正匹配概率的权重,wn=负匹配概率的权重,op=正匹配概率,on=负匹配概率。响应于总体匹配概率满足阈值(例如,等于或大于;或等于或小于)的,则数据处理系统可以生成链接。

图3a和3b是根据一个或多个实施方式的来自多个计算设备的计算机网络活动的图。数据处理系统可以基于链接数据结构来生成用于显示的图表。数据处理系统可以使用第一因子、第二因子或第三因子来生成该图表。该图表可以图示或指示链接或匹配概率。图3a的图表300可以指示正匹配概率的链接因子。曲线图300包括针对时间的水平轴305和针对设备上的活动的垂直轴310。时间可以是分钟、秒、小时或其它时间单位。轴310表示设备1(315)上的活动和设备2(320)上的活动。设备1(315)可以是诸如单个标识符设备、参考设备或链接设备的第一计算设备。设备2(320)可以是第二计算设备。绘制在图表300上的活动可以指示活动级别,诸如高级别活动或被动(或无)活动。例如,虚线355、360、365、370、375和380可以分别指代设备1和设备2上的被动活动。实线325、330、335、340、345和350可以表示高级别的活动。如图表300所图示,设备1(315)的高级别活动325对应于设备2(320)上的被动活动或无活动355。该模式贯穿时间0至45期间持续存在。例如,设备2上的高级别活动340对应于设备1上的无活动或被动活动370;设备2上的被动活动或无活动360对应于设备1上的高级别活动330;设备2上的高级别活动345对应于设备1上的被动活动或无活动375;设备2上的被动活动或无活动365对应于设备1上的高级别活动335;并且设备2上的高级别活动350对应于设备1上的被动活动或无活动380。因此,由于两个计算设备315和320不同时具有高级别的活动,因此这可以触发正链接因子(或不增加负匹配概率)。此外,两个计算设备可以在相同或不同的位置。

图3b的图表301可以指示负匹配概率的链接因子。图表301包括针对时间的水平轴306和针对在设备上的活动的垂直轴311。时间可以是分钟、秒、小时或其它时间单位。轴311表示设备3(316)上的活动、以及设备4(321)上的活动。设备2(316)可以是诸如单个标识符设备、参考设备或链接设备的第一计算设备。设备4(321)可以是第二计算设备。绘制在图表301上的活动可以指示活动级别,诸如高级别活动或被动(或无)活动。例如,虚线326、341和351可以分别指代设备3和4上的被动活动。实线331、336、346和356可以表示高级别的活动。如图表301所图示,设备1(316)的高级别活动336与设备4(321)上的被动(或无)活动326和高级别活动331两者均重叠。这可能不指示正匹配,或者可能指示负匹配。该模式贯穿时间0到40期间持续存在。例如,设备4(321)上的高级别活动331继续与设备3(316)上的被动(或无)活动341和高级别活动346重叠;并且设备4(321)上的高级别活动331继续与设备3(316)上的被动(或无)活动351和高级别活动356重叠。因此,由于两个计算设备316和321同时具有高级别活动(例如,主动输入活动),因此这可以触发负链接因子(或不增加正匹配概率)。如果两个计算设备321和316处于不同的位置,则这可以进一步增加负匹配概率。设备321和316之间的距离量可以进一步增加负匹配概率。例如,如果两个设备分开5英里,但是两者同时表现出高活动级别,则相同用户不可能同时使用这两个设备,从而指示非链接。

图4是根据说明性实施方式的计算机系统400的框图。计算机系统或计算设备400可用于实现系统100、系统300、内容提供者125、计算设备110、内容发布者115、数据处理系统120、匹配引擎130、连接器135、内容选择器140、地理位置模块150、和数据储存库145。计算系统400包括用于传输信息的总线405或其它通信组件以及耦合到总线405以用于处理信息的处理器410或处理电路。计算系统400还可以包括耦合到总线以用于处理信息的一个或多个处理器410或处理电路。计算系统400还包括耦合到总线405以用于存储信息以及待由处理器410执行的指令的主存储器415,诸如随机存取存储器(ram)或其它动态存储设备。主存储器415也可以被用于存储位置信息、临时变量、或在由处理器410执行指令期间的其它中间信息。计算系统400还可以包括耦合到总线405以用于存储处理器410的静态信息和指令的只读存储器(rom)420或其它静态存储设备。诸如固态设备、磁盘或光盘的存储设备425耦合到总线405以用于持久地存储信息和指令。

计算系统400可以经由总线405耦合到诸如液晶显示器或有源矩阵显示器的显示器435以用于向用户显示信息。诸如包括字母数字和其它键的键盘的输入设备430可以耦合到总线405,以用于将信息和命令选择传输到处理器410。输入设备430可以包括触摸屏显示器435。输入设备430还可以包括诸如鼠标、轨迹球或光标方向键的光标控制,以用于将方向信息和命令选择传输到处理器410并用于控制显示器435上的光标移动。

本文描述的过程、系统和方法可以由计算系统400响应于处理器410执行包含在主存储器415中的指令的布置来实现。这样的指令可以从另一计算机可读介质——诸如存储设备425——读取到主存储器415中。包含在主存储器415中的指令的布置的执行使得计算系统400执行本文所述的说明性过程。也可以采用处于多处理装置的一个或多个处理器来执行包含在主存储器415中的指令。在替选实施方式中,可以使用硬连线电路替代软件指令或与软件指令组合来实现说明性实施方式。因此,实施方式不限于硬件电路和软件的任何特定组合。

虽然在图4中已经描述了示例性计算系统,本说明书中描述的主题的实施方式和功能操作可以在其它类型的数字电子电路中、或在计算机软件、固件或硬件中实现——包括在本说明书中公开的结构及其结构等同物、或它们中的一个或多个的组合。

可以以数字电子电路或以计算机软件、固件、或硬件实现本说明书中描述的主题和操作的实施方式——包括在本说明书中公开的结构及其结构等同物、或以它们中的一个或多个的组合来实现。本说明书中描述的主题可以被实现为一个或多个计算机程序,例如,编码在一个或多个计算机存储介质上以用于由数据处理装置执行或控制数据处理装置的操作的一个或多个计算机程序指令的电路。替选地或附加地,程序指令可以被编码在人工生成的传播信号上,该信号例如机器生成的电、光或电磁信号,其被生成以编码信息以用于传输到合适的接收器装置以供数据处理装置执行。计算机存储介质可以是以下或可以被包括在以下中:计算机可读存储设备、计算机可读存储基底、随机或串行存取存储器阵列或设备中、或它们中的一个或多个的组合中。而且,虽然计算机存储介质不是传播信号,但计算机存储介质可以是在人工生成的传播信号中编码的计算机程序指令的源或目标。计算机存储介质也可以是或者可以被包括在一个或多个分立的组件或介质中(例如,多个cd、盘或其它存储设备)。

可由数据处理装置对存储在一个或多个计算机可读存储设备上或从其它源接收的数据执行本申请文件中描述的操作。

术语“数据处理装置”或“计算设备”包括用于处理数据的各种装置、设备和机器,包括例如可编程处理器、计算机、片上系统、或以上的多个或组合。该装置可以包括专用逻辑电路,例如fpga(现场可编程门阵列)或asic(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机、或其中的一个或多个的组合的代码。所述装置和执行环境可以实现各种不同的计算模型基础架构,诸如web服务、分布式计算和网格计算基础架构。

计算机程序(也称为程序、软件、软件应用、脚本、或代码)可以以任何形式的编程语言编写,包括编译或解释语言、声明式语言或过程式语言,并且其可以以任何形式来部署,包括作为独立的程序或者作为适合在计算环境中使用的电路、组件、子例程、对象,或者其它单元。计算机程序可以但不是必须地对应于文件系统中的文件。程序可以存储在保存其它程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如,存储一个或多个电路、子程序、或代码部分的文件)。计算机程序可以被部署为在一个计算机上执行,或在多个位于一个地点或跨多个地点分布且通过通信网络互连的计算机上执行。

适合执行计算机程序的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。总体而言,处理器将从只读存储器或随机存取存储器或这两者接收指令和数据。计算机的必需元件是用于根据指令执行动作的处理器和一个或多个用于存储指令和数据的存储器设备。总体而言,计算机还将包括一个或多个大容量存储设备——例如磁盘、磁光盘或光盘,或操作地耦合至其以从其接收数据或向其传送数据,或这两者。然而,计算机不必一定具有这样的设备。而且,计算机可以被嵌入在另一设备中,例如,移动电话、个人数字助理(pda)、移动音频或视频播放器、游戏控制台、全球定位系统(gps)接收器、或者便携式存储设备——例如通用串行总线(usb)闪速驱动器等。适于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,例如包括:半导体存储器设备,例如eprom、eeprom和闪存设备;磁盘,例如内置硬盘或可移动盘;磁光盘;以及cd-rom和dvd-rom盘。处理器和存储器可由专用逻辑电路补充或并入其中。

为了提供与用户的交互,本说明书中描述的主题的实施方式可以实现在计算机上,该计算机具有显示设备——例如crt(阴极射线管)或lcd(液晶显示器)监视器以用于向用户显示信息;以及键盘和指示设备(例如鼠标或轨迹球),用户可以用这些设备向计算机提供输入。其它类型的设备也可用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈、或触觉反馈;并且可以接收来自用户的任何形式的输入,包括声音、语音或触觉输入。

虽然本说明书包含许多具体的实施方式细节,但是这些说明不应被解释为对任何发明的范围或所要求保护的范围的限制,而是应当解释为对特定发明的特定实施方式特有的特征的描述。在本说明书中描述的在单独实施方式的场境中的某些特征也可以在单个实施方式中组合地实现。相反,在单个实施方式的场境中描述的各种特征也可以分开地或以任何合适的子组合在多个实施方式中实现。此外,虽然以上可以将特征描述为以某些组合的方式起作用,并且甚至最初如此要求保护,但来自权利要求的一个或多个特征在某些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或者子组合的变体。

类似地,虽然在附图中以特定顺序描绘操作,但是这不应被理解为要求以所示的特定次序或顺序地执行这些操作、或者执行所有所示的操作以获得期望的结果。在某些情况下,多任务和并行处理可能是有利的。而且,上述实施方式中的各种系统组件的分离不应被理解为在所有实施方式中需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以集成在单个软件产品中或者被打包成多个软件产品。

对“或”的引用可以被解释为是包含性的,使得使用“或”描述的任何术语可以指示所描述的术语中的单个、多于一个术语和全部术语中的任何一个。

因此,已经描述了主题的特定实施方式。其它实施方式在所附权利要求的范围内。在一些情况下,权利要求中所述的动作可以以不同的顺序执行并且仍然实现期望的结果。此外,附图中所描绘的过程不一定需要所示的特定次序或顺序次序来获得期望的结果。在某些实施方式中,多任务和并行处理可能是有利的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1