用于受众测量的系统和方法

文档序号:10494730阅读:390来源:国知局
用于受众测量的系统和方法
【专利摘要】为提供安全单一源样本库受众测量数据,同时提供样本库成员的机密性和安全性,受众测量服务器可以捕捉内容标识符和接收内容的设备的客户端标识符。样本库提供者可以经由客户端标识符的散列,生成概率数据结构。受众测量服务器可以利用过滤器数组来提取包括样本库成员的数据以及作为误报的一些非样本库成员的数据在内的测量数据的子集,而不能够区分成员和非成员。受众测量服务器可以利用与数据项对应的每个客户端标识符作为密钥,来加密所提取的数据的子集,并且将经加密的数据发送到样本库提供者,因此包括样本库和一些非样本库数据,样本库提供者仅能够解密与其自己的样本库成员对应的数据。
【专利说明】
用于受众测量的系统和方法
【背景技术】
[0001]通常经由随时间的个人或家庭记录内容曝光组成的单一源数据样本库(panel),来测量包括商业广告的内容块(诸如广播媒体或在线流媒体)的受众。然后,将用于每一块的潜在受众值用于计划和购买广告位。通过利用单一来源,随响应于不同活动的时间来测量行为的变化。在诸如在线媒体分发系统的非广播平台中,内容发布者可能经由视频、横幅等中的插播广告,为用户插入广告。样本库成员可以运行将所接收的内容的标识符传送到样本库提供者用于聚合的监控软件,诸如浏览器插件或扩展。然而,不同的内容发布者可以以不同方式识别内容,并且样本库可以以不同方法或用不同标准收集数据,导致难以捕捉用于样本库的所有内容曝光或难以对来自不同样本库的内容曝光进行聚合。

【发明内容】

[0002]为提供跨媒体受众测量数据或来自与样本库捕捉的数据集成的不同源的数据,可以将轻量级通信或“ping”从客户端设备传送到受众测量服务器。ping可以包括客户端设备的设备标识符,诸如样本库会话标识符或cookie,以及内容的识别。内容可以包括视频、音频、多媒体、广告或任何其他类型或形式的内容。在一些实施方式中,测量服务器可以过滤与样本库提供者的特定样本库相关联的业务并且将ping或ping的信息转发到所述样本库提供者。这样的实施方式可能不要求任何客户端侧的浏览器插件或其他代理。在一些实施方式中,样本库提供者可以通过使客户端设备首先登录到样本库提供者并且接收会话标识符,向受众测量服务器注册用户。客户端设备可以将会话标识符传送到受众测量服务器并且接收coo lie或设备标识符。
[0003]在另一实施方式中,因为一些样本库提供者要求保密性,因此,提供者可能不需要向受众测量服务器识别它们的样本库成员。相反,在这些实施方式中,客户端可以从受众测量服务器接收cookie或设备标识符,而不需要识别样本库提供者或会话标识符。可以将cookie或设备标识符提供给样本库提供者,用于对样本库成员的识别,以及可以通过受众测量服务器,由cookie或设备标识符存储和跟踪受众数据。随后,样本库提供者可以经由cookie或设备标识符的散列,生成概率数据结构,诸如Bloom过滤器或商过滤器数组。样本库提供者可以将数组提供给受众测量服务器,其可以利用该过滤器来提取包括样本库成员的数据在内的测量数据的子集,以及作为误报的一些非样本库成员的数据。受众测量服务器可以利用与数据项对应的每个cookie或设备标识符作为密钥,加密所提取的数据子集,并且将经加密的数据发送到样本库提供者,因此包括样本库和非样本库数据两者。样本库提供者可以尝试使用与样本库成员相关联的cookies或设备标识符,解密每个所接收的数据项。因为样本库提供者仅知道它自己的cookie信息,它将仅能成功地解密其自己的样本库数据,将不能解密与非成员对应的数据。因此,使受众测量服务器对样本库成员服务器保密,而样本库提供者仅能提供对它们自己的样本库的数据的访问。
[0004]本文公开的一种实施方式是一种用于安全在线受众测量的方法。所述方法包括:由第一设备所执行的受众测量服务器接收从多个客户端设备中的每个客户端设备所传送的通信,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作。所述方法进一步包括由受众测量服务器从第二设备接收对样本库测量服务的成员的测量数据的请求,所述请求包括与多个客户端设备的第一部分的每个设备标识符的散列对应的概率数据结构。所述方法还包括由受众测量服务器,经由概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括多个客户端设备的第一部分的设备标识符在内的通信,以及(ii)包括不与样本库成员对应的多个客户端设备的第二部分的设备标识符在内的通信。所述方法进一步包括对所选择的子集中的每个通信,由受众测量服务器利用每个所述通信中的对应的设备标识符,加密内容项的识别以产生经加密的测量数据。所述方法还包括由受众测量服务器将经加密的测量数据传送到第二设备。
[0005]在所述方法的一些实施方式中,响应于所述客户端设备从内容提供者接收内容项,传送从多个客户端设备中的客户端设备所传送的每个通信。在许多实施方式中,第二设备成功地解密与多个客户端设备的第一部分的设备标识符对应的内容项的识别,并且不能解密不与多个客户端设备的第一部分的设备标识符对应的内容项的识别。
[0006]在所述方法的一些实施方式中,由每个客户端设备所接收的内容项包括使所述客户端设备将通信传送到第一设备的命令。在一些实施方式中,通过样本库测量服务,生成多个客户端设备的第一部分的客户端设备的设备标识符。
[0007]在一些实施方式中,所述方法包括由受众测量服务器从客户端设备接收对设备标识符的请求;由受众测量服务器生成设备标识符;以及由受众测量服务器将设备标识符传送到客户端设备,所述设备标识符是由客户端设备响应于所述设备代表样本库测量服务的成员来操作,而提供给样本库测量服务的。
[0008]在所述方法的许多实施方式中,概率数据结构包括布隆过滤器。在其他实施方式中,概率数据结构包括商过滤器。在一些实施方式中,所述方法包括通过确定通信的设备标识符的散列与概率数据结构的一部分匹配;以及响应于对设备标识符的散列与概率数据结构的所述部分匹配的确定,将所述通信包括在所选择的子集中,来过滤所接收的通信来选择所接收的通信的子集。在其他实施方式中,所述方法包括通过确定通信的设备标识符的散列与概率数据结构的一部分不匹配;以及响应于对设备标识符的散列与概率数据结构的一部分不匹配的确定,从所选择的子集中排除所述通信,来过滤所接收的通信来选择所接收的通信的子集。
[0009]在本公开中提出的另一实施方式是一种用于安全在线受众测量的系统。所述系统包括与多个客户端设备通信的第一设备,包括处理器和存储器。所述处理器被配置为接收从多个客户端设备中的每个客户端设备所传送的通信,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作。处理器还被配置为从对第二设备接收样本库测量服务的成员的测量数据的请求,所述请求包括与多个客户端设备的第一部分的每个设备标识符的散列对应的概率数据结构。处理器被进一步配置为经由概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括多个客户端设备的第一部分的设备标识符在内的通信,以及
(ii)包括不与样本库成员对应的多个客户端设备的第二部分的设备标识符在内的通信。处理器还被配置为对所选择的子集中的每个通信,利用每个所述通信中的对应的设备标识符,加密内容项的识别以产生经加密的测量数据。处理器还被配置为将经加密的测量数据传送到第二设备。
[0010]在所述系统的一些实施方式中,响应于所述客户端设备从内容提供者接收内容项,传送从多个客户端设备中的客户端设备所传送的每个通信。在其他实施方式中,第二设备成功地解密与多个客户端设备的第一部分的设备标识符对应的内容项的识别,并且不能解密不与多个客户端设备的第一部分的设备标识符对应的内容项的识别。
[0011]在所述系统的一些实施方式中,由每个客户端设备所接收的内容项包括使所述客户端设备将通信传送到第一设备的命令。在其他实施方式中,通过样本库测量服务,生成多个客户端设备的第一部分的客户端设备的设备标识符。
[0012]在所述系统的一些实施方式中,所述处理器被进一步配置为从客户端设备接收对设备标识符的请求;生成设备标识符;以及将设备标识符传送到客户端设备,所述设备标识符是由客户端设备响应于设备代表样本库测量服务的成员来操作,而提供给样本库测量服务的。在所述系统的许多实施方式中,概率数据结构包括布隆过滤器或商过滤器。
[0013]在所述系统的一些实施方式中,所述处理器被进一步配置为确定通信的设备标识符的散列与概率数据结构的一部分匹配;以及响应于对设备标识符的散列与概率数据结构的所述部分匹配的确定,将所述通信包括在所选择的子集中。在其他实施方式中,所述处理器被进一步配置为确定通信的设备标识符的散列与概率数据结构的一部分不匹配;以及响应于对设备标识符的散列与概率数据结构的一部分不匹配的确定,从所选择的子集排除所述通信。
[0014]在本公开中提出的另一实施方式是一种存储指令的计算机可读存储介质,所述指令当由一个或多个数据处理器执行时,致使一个或多个数据处理器执行包括接收从多个客户端设备中的每个客户端设备所传送的通信的操作,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作。所述操作还包括从第二设备接收对样本库测量服务的成员的测量数据的请求,所述请求包括与多个客户端设备的第一部分的每个设备标识符的散列对应的概率数据结构。所述操作进一步包括经由概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括多个客户端设备的第一部分的设备标识符在内的通信,以及(ii)包括不与样本库成员对应的多个客户端设备的第二部分的设备标识符在内的通信。所述操作还包括对所选择的子集中的每个通信,利用每个所述通信中的对应的设备标识符,加密内容项的识别以产生经加密的测量数据。所述操作还包括将经加密的测量数据传送到第二设备。
[0015]提及这些实施方式不是限制或限定本公开的范围,而是提供本公开的实施方式的示例来帮助理解。可以开发【具体实施方式】来实现下述益处中的一个或多个。
【附图说明】
[0016]在下面的附图和说明书中,阐述一个或多个实施方式的细节。通过说明书、附图和权利要求,本公开的其他特征、方面和益处将变得显而易见,其中:
[0017]图1A是根据一种实施方式,用于对由至少一个内容提供者所提供的内容的受众进行测量的系统的图;
[0018]图1B是根据一种实施方式,利用与样本库提供者捕捉的数据相聚合的由受众测量服务器所提供的数据,用于对由至少一个内容提供者所提供的内容的受众进行测量的系统的图;
[0019]图1C是根据一种实施方式,用于经由受众测量服务器,对由至少一个内容提供者所提供的内容的受众进行测量的系统的图;
[0020]图1D是根据一种实施方式,用于利用受众测量服务器对样本库成员进行注册的系统的图;
[0021 ]图2A是根据一种实施方式的客户端设备的框图;
[0022]图2B是根据一种实施方式的服务器设备的框图;
[0023]图3A是根据一种实施方式,用于利用受众测量服务器对样本库成员进行注册的过程的一种实施方式的信号流图;
[0024]图3B是根据一种实施方式,经由受众测量服务器,用于受众测量的过程的一种实施方式的信号流图;
[0025]图4A是根据一种实施方式,用于过滤受众测量数据的概率数据结构的生成的示例的图;
[0026]图4B是根据一种实施方式,用于过滤受众测量数据的概率数据结构的使用的示例的图;
[0027]图5是根据一种实施方式,经由受众测量服务器,在受众测量的过程的一种实施方式中采用的步骤的流程图。
[0028]各种图中相同的参考数字和名称表示相同的元素。
【具体实施方式】
[0029]受众测量数据可以包括由设备所接收和显示的内容的识别。这样的内容可以包括音频、视频、多媒体、文本、动画、广告或其他这样的数据。内容的受众的测量可能对于下列目的很有用:测量受众规模或内容的流行性用来定价和出售广告位、计划内容分发时间表或其他这样的目的。在传统的地面或卫星广播中,由于缺少从接收机到提供者的反向信道或通信路径,提供者可能无法直接了解任一时刻调谐的接收机的数量。为克服该限制,受众测量系统已经使用了个人的样本库,所述个人参与同意填写他们看到或收听的内容的调查或日记,或穿戴或携带检测附近回放的内容并且记录后续传输到样本库提供者的日志的便携式设备。
[0030]与典型广播者不同,互联网内容提供者经由对传出分组的目的地进行监测,或通过从每个接收者设备请求返回响应,可以直接了解到接收者设备的数量。然而,当内容分发系统变得越复杂时,可以由不同提供者将不同内容项提供给设备。例如,可以由第一web月艮务器提供网站,而由独立的内容分发网络提供嵌入视频,以及可以由一个或多个单独的广告分发网络提供一个或多个横幅广告或插播视频广告。因此,单个提供者可能实际上仅了解由所述单个提供者提供的内容的接收者的数量,因此不能够准确地测量全部受众数量。在具有大量源的内容分发网络的情况下这会进一步变复杂,其中,例如,为负载平衡的目的,可以使用不同独立服务器来将内容提供给设备。
[0031]在捕捉分发到设备的内容的识别的系统的一种实施方式中,可以在诸如Web浏览器插件或分组拦截器的设备上执行代理,或可以在接收者设备和内容提供者之间的中间设备(诸如路由器、WiFi接入点、网关或其他这样的设备)上执行代理。例如,参见图1A,示出了根据一种实施方式,对由至少一个内容提供者提供的内容的受众进行测量的系统的图。客户端设备100可以经由网络106,与一个或多个内容提供者108和样本库提供者110通信。客户端设备100,不同地被称为客户端、设备、客户端设备、计算设备、用户设备或任何其他这样的术语,可以是能够通过网络106通信的台式计算机、膝上型计算机、平板计算机、智能电话、视频游戏机、智能电视或机顶盒、服务器、工作站或任何其他类型或形式的计算设备。尽管为了清楚起见,仅图示了一个客户端设备100,实际上,多个客户端设备100可以相互和/或与内容或样本库提供者108至110通信。
[0032]在一些实施方式中,客户端设备100可以执行应用102,其可以是用于在网络106上通信的应用、服务、服务器、后台进程、例程或其他可执行逻辑,诸如Web浏览器、邮件客户端、音乐播放器、视频播放器、视频游戏或任何其他这样的应用。应用102可以包括命令行界面、图形用户界面或这些或其他界面的任何组合。
[0033]客户端设备100可以包括设备标识符101。设备标识符101可以是字母数字串、数据串、序列号、媒体访问控制(MAC)地址、互联网协议(IP)地址、用户名或帐户名、全局唯一标识符(GUID)、C00kie、随机或伪随机数或任何其他类型或形式的标识符,包括这些或其他标识符的组合。在一些实施方式中,可以将设备标识符101固定到设备上或预配置在设备中,诸如制造商序列号或MAC地址,而在其他实施方式中,可以由样本库提供者110、应用102或其他实体动态地设定设备标识符104,诸如cookie或用户名。在一些实施方式中,可以为与样本库提供者110的每个通信设定唯一或新的设备标识符101,而在其他实施方式中,设备标识符101可以不被改变,或可以周期性地(例如,每小时、每天、每周等)或以其他间隔(例如,在客户端设备100重启、登录到互联网服务等时)改变。
[0034]客户端设备100可以执行捕捉代理104。捕捉代理104可以是Web浏览器插件或扩展、分组嗅探器或拦截器、屏幕截取器、文本或数据解析器、监控器、应用、服务、后台程序、例程或其他可执行逻辑,所述可执行逻辑用于识别提供给客户端设备100的内容以及将内容的识别(以及,在一些实施方式中,设备标识符101)传送到样本库提供者110或其他测量服务。在许多实施方式中,尽管被图示为应用102的一部分,捕捉代理104可以是单独的应用或服务。此外,如上面所讨论的,在一些实施方式中,可以由在客户端100与网络106和/或内容提供者108之间所部署的中间设备(未图示出)来执行捕捉代理104。
[0035]客户端设备100可以经由网络106,与内容提供者108和/或样本库提供者110、或其他客户端设备100、服务器或设备通信。网络106可以是任何形式的计算机网络,或在客户端设备100、一个或多个内容提供者108和一个或多个样本库提供者110,以及未图示的其他设备之间中继信息的网络的组合。例如,网络106可以包括互联网和/或其他类型的数据网络,诸如局域网(LAN)、广域网(WAN)、蜂窝网络、卫星网络或其他类型的数据网络。网络106也可以包括被配置为在网络106内接收和/或传送数据的任意数量的计算设备(例如,计算机、月艮务器、路由器、网络交换机等)。网络106可以进一步包括任意数量的硬布线和/或无线连接。例如,客户端设备100可以与(例如,经由光纤电缆、CAT5电缆等)硬布线到网络106中的其他计算设备的收发器(例如,经由WiF1、蜂窝、无线电等)无线通信。在一些实施方式中,网络106可以是虚拟网络,诸如由单个物理机执行的多个虚拟机之间的虚拟网络,或抽象网络,诸如经由物理可移动介质的数据离线传递(例如,Sneakernet,经由磁带介质、⑶-ROM、闪速存储器介质、外部硬盘驱动、软盘等传递数据)。
[0036]内容提供者108可以包括被连接到网络106并且被配置为将内容提供给客户端100的一个或多个计算设备。内容提供者108可以不同地被称为内容提供者、服务器、Web服务器、数据服务器、发布者、服务提供者或通过其他类似术语。在许多实施方式中,内容提供者108可以包括被配置为服务器场或云的多个计算设备,并且可以包括路由器、负载平衡器、网络地址转换器、防火墙或其他这样的设备。例如,内容提供者108可以是计算机服务器(例如,FPT服务器、文件共享服务器、Web服务器等)或服务器的组合(例如,数据中心、云计算平台等)。内容提供者108可以提供任何类型和形式的内容,包括文本、图像、视频、音频、多媒体或其他数据,或这些的任意组合。内容可以包括搜索结果、博客或论坛内容、新闻文章、电影、电视节目、播客、视频游戏或以任何格式、网站、社交媒体广告的其他交互内容,或任何其他类型和形式的内容。例如,内容提供者108可以是响应于搜索查询,将搜索结果数据提供给客户端设备100的在线搜索引擎。在另一示例中,内容提供者108可以是响应于对网页的请求,将网页数据提供给客户端设备100的第一方Web服务器。在又一示例中,内容提供者108可以是视频流服务,所述视频流服务将电视节目或电影,连同插播视频广告、横幅广告、片头或片尾广告或其他这样的内容流式传输至客户端100或提供用于这样的广告或其他这样的内容的插入点以使客户端100从一个或多个其他内容提供者请求内容。
[0037]根据各种实施方式,内容提供者108可以将包括一个或多个内容标签的第一方网页数据提供给客户端设备100。通常,内容标签是指与包括具有第一方网页的第三方内容在内的动作相关联的网页代码的任意片段。例如,内容标签可以定义用于第三方内容的网页的位、用于第三方内容外的页面的位(例如,插播位)、是否应当异步或同步加载第三方内容、是否应当在网页上禁止对第三方内容进行加载、是否应当刷新未成功加载的第三方内容、提供第三方内容的内容源的网络位置(例如,另一内容提供者108、样本库提供者110等)、与点击第三方内容相关联的网络位置(例如,URL)、如何在显示器上呈现第三方内容、(经由通过图像请求设置cookie的像素标签)使客户端设备100设置浏览器cookie的命令、用来检索第三方内容的一个或多个关键字以及与向第三方内容提供第一方网页相关联的其他功能。例如,内容提供者108可以将第一方网页数据供给客户端设备100,使客户端设备100将请求发送到样本库提供者110。
[0038]样本库提供者110可以包括被连接到网络106并且被配置为从一个或多个客户端设备100接收内容标识符,所述一个或多个计算设备用于在聚合数据库112中聚合和/或用于分析或受众测量。样本库提供者110可以不同地被称为鉴定器、测量系统、服务器、数据服务器、服务提供者或用其他类似术语。样本库提供者110可以是被配置在用于分布式处理的服务器场或服务器云中的多个设备,以及可以提供其他功能。在一种实施方式中,样本库提供者110可以是一个或多个内容提供者108和客户端100之间的中间媒介,而在其他实施方式中,样本库提供者110可以经由网络106,与内容提供者108通信。
[0039]在经由图1A的示例信号流中所图示的样本库成员的客户端设备的受众测量的一种实施方式中,在步骤A处,客户端设备100可以将对内容的请求传送到内容提供者108ο请求可以是以任何形式或协议,诸如用于新闻文章或网页的其他内容的超文本传输协议(HTTP)GET请求。在其他实施方式中,请求可以是用于被流式传输的视频,诸如电视节目或电影。在步骤B处,内容提供者108可以将内容传送到客户端100ο在步骤C处,捕捉代理104可以识别所传送的内容并且将内容标识符(并且,在一些实施方式中,设备标识符101)传送到样本库提供者110用于存储和聚合。内容标识符可以包括统一资源定位符(URL)、统一资源标识符(URI)、字母数字串、文件名、替选标识符(替选ID)或任何其他这样的信息。在一些实施例中,内容标识符可以包括内容在页面上的放置(例如,上框或下框中)或页面层级内的内容的位置的识别(例如,页面的嵌入元素的产物(c h i I d))。
[0040]样本库提供者110可以创建聚合数据库112,可以包括数据库、平面文件、数据文件、数组或任何其他类型和形式的数据结构,所述数据结构用于存储和聚合从样本库成员所接收的内容标识符和/或设备标识符。聚合数据库112可以被存储在样本库提供者110的服务器的存储器中、外部存储设备中,或另一设备的存储器上,诸如存储区域网络(SAN)、网络附加存储(NAS)、云存储或任何其他类型和形式的存储设备。
[0041]图1A中所图示的示例实施方式允许对分发到客户端设备100的内容的一些项的识另IJ,但要求将捕捉代理104安装在客户端上。甚至出于安全或隐私问题,同意加入样本库或选择性加入的个人可能不希望在他们的设备上安装插件或拦截器。此外,这样的技术可能对加密内容不起作用,所述加密内容诸如经由超文本传输协议安全协议(HTTP)或经由虚拟专用网(VPN)分发的内容,并且可能不以相同的方式,捕捉不同格式或类型的内容的数据,使内容分发测量的聚合变得困难。
[0042]在不要求对单独的客户端侧代理的执行的情况下,经由在本文中公开的方法和系统,通过捕捉从客户端设备被传送到受众测量服务器的轻量级通信或“Ping”,测量内容分发和受众。Ping可以包括客户端设备的设备标识符,诸如样本库会话标识符或cookie,以及内容的识别。在一些实施方式中,Ping可以包括布局内的内容放置的识别,诸如横幅的位置、帧的识别或其他这样的指示符。可以响应于对网页或其他数据的呈现、对嵌入式脚本执行或其他这样的功能,传送ping。例如,在一种实施方式中,ping可以是用于具有参数值对的一个像素图像的超文本传输协议(HTTP)GET请求以识别通过(诸如响应于PING标签)触发GET请求或单独的HTTP请求的页面显示或嵌入该页面中的设备标识符和内容。在另一实施方式中,Ping可以是对内容项的请求并且可以被传送到受众测量服务器,所述受众测量服务器将请求(例如,经由HTTP 302重定向或类似方法)重定向到内容提供者。
[0043]图1B所图示的是根据一种实施方式,通过由受众测量服务器提供的数据聚合,用于对由至少一个内容提供者所提供的内容的受众进行测量的系统的图。受众测量服务器114可以包括一个或多个设备,所述一个或多个设备从客户端100接收内容标识符和/或设备标识符,并且将所接收的内容标识符和/或设备标识符提供给样本库提供者110。在一些实施方式中,尽管与样本库提供者110和内容提供者108并行地被图示,仍可以将受众测量服务器114配置为样本库提供者110和内容提供者中的一个或两个与客户端100之间的中间设备。
[0044]在图1B中所图示并且类似于上文图1A的示例性流中,在步骤A处,客户端设备100可以将对内容的请求传送到内容提供者108。在步骤B处,内容提供者108可以将内容传送到客户端100。在一些实施方式中,在步骤C处,捕捉代理104可以识别所传送的内容并且将内容标识符(以及,在一些实施方式中,设备标识符101)传送到样本库提供者110用于存储和聚合。在其他实施方式中,诸如在捕捉代理104未被安装在客户端100上的情况下,或捕捉代理104不能检测内容的情况下(例如,如果在其他内容内加密或嵌入内容),步骤C可以被跳过或是可选择的。
[0045]在步骤D处,客户端的应用102可以将内容标识符和/或设备标识符101传送到受众测量服务器。在一些实施方式中,应用102可以响应于包括在所接收的内容中的命令(诸如使Web浏览器102从受众测量服务器114请求对应的图像的HTTP文档中的頂G标签)传送内容标识符和/或设备标识符101。这样的图像可以是逐个像素图像或透明图像以避免一旦接收了图像,由客户端100所显示的任何视觉伪像。内容标识符可以是图像的URL的一部分,或在请求中所传送到服务器的URL的参数。例如,在一个这样的实施方式中,不同的URL可以被包括在被传送到客户端的每个内容项的页面中(例如,识别预定第一内容项的“http://www.example.com/img/content_id_001.jpg” ),而在另一个这样的实施方式中,内容可以被识别为参数(例如,“http://www.example.com/img/content?id_001” )。仍然可以使用将内容标识符传送到受众测量服务器的其他方法。例如,在一些实施方式中,内容的嵌入标签或链接可以包括使应用102传送用于由标签中的URL所识别的文档或内容的第一请求,以及将第二通信传送到由PING标签所指定的URL(例如,受众测量服务器114)的HTML PING标签。还是在在另一实现中,应用102可以请求受众测量服务器114的URL处的内容,其可以存储所请求的内容的识别,以及利用识别内容提供者108处所请求内容的URL的HTTP重定向(例如,状态码302或指定不同URL的HTTP刷新报头)作出响应。在许多实施方式中,应用102可以包括设备标识符1I或具有请求的cooki e,例如作为HTTP GET请求内的cooki e。
[0046]在步骤E处,可以通过受众测量服务器114,将内容标识符和/或设备标识符101转发到样本库提供者110。在一些实施方式中,内容标识符可以立即被转发,而在其他实施方式中,内容标识符和/或设备标识符101可以被存储并且与其他所接收的内容标识符聚合,以便后续传输到样本库提供者110。
[0047]在一些实施方式中,诸如由客户端设备100执行捕捉代理104的情况下,样本库提供者可以聚合在步骤C处从捕捉代理所接收的数据以及在步骤E处从受众测量服务器114所接收的数据。例如,在步骤C处所接收的数据可以识别由客户端设备100所接收的横幅广告和网页,而在步骤E处,从受众测量服务器114所接收的数据可以识别视频、流式传输的电视节目或电影、视频游戏或其他内容中的插播广告。样本库提供者110可以按设备标识符组合和聚合该数据以创建呈现给设备100的内容的整个日志或记录。在许多实施方式中,在步骤E处所接收的内容标识符还可以包括用于在步骤C处所识别的内容的内容标识符;在这些实施方式中,当组合数据时,样本库提供者110可以移除重复。在一些实施方式中,内容标识符可以包括时间戳以在这样的关联和重复条目移除中提供帮助。
[0048]如图1B中所描绘的实施方式中所示出的,受众测量服务器114可以接收由客户端设备100显示的所有内容的内容标识符,并且因此提供给比捕捉代理104更完整的记录。因此,在许多实施方式中,在客户端设备100上不需要安装捕捉代理104。图1C是经由受众测量服务器,对由至少一个内容提供者所提供的内容的受众进行测量的系统的一种实施方式。与图1B的步骤D和E类似,受众测量服务器114可以在步骤C处接收内容标识符和/或设备标识符101,并且在步骤D处,将标识符转发或聚合并转发标识符到样本库提供者110。在许多实施方式中,如所示出的,可以由受众测量服务器114聚合数据,减轻样本库提供者110的服务器的负载。在未图示出的其他实施方式中,可以将数据传送到样本库提供者110,用于在聚合数据库112中存储。
[0049]在进一步的实施方式中,诸如图1C的步骤C中所示的,受众测量服务器114将识别内容标识符和设备标识符的通信的一部分重定向到样本库提供者110。例如,受众测量服务器114可以利用识别样本库提供者110的URL的HTTP刷新或重定向,来响应于通信的部分,诸如通信的1%、5%或任何其他部分。这可以允许样本库提供者110从客户端设备直接接收受众测量数据的一部分,并因此统计地审核从受众测量服务器114所接收的聚合数据。
[0050]在单一源样本库测量的许多实施方式中,样本库提供者110请求用户或设备诸如经由用户名或帐户名或密码或其他认证系统,与样本库提供者认证或登录。完成此以允许随时间(诸如随多个会话、多天、多周或其他这样的周期),跟踪被显示给特定用户或传送到设备的内容。在一些实施方式中,经由上面所讨论的的浏览器插件或收集代理,来处理认证。在其他实施方式中,可以经由登录到样本库提供者的服务,来处理认证,并且样本库提供者可以将会话标识符或cookie传送到设备。可以设定会话标识符或cookie在预定时间量后,或一旦结束了会话时失效(例如,终止对Web浏览器或应用的执行,重启计算设备或使设备进入睡眠等)。
[0051]在一些实施方式中,在不要求收集代理的情况下,为允许在会话或其他时间段期间,对由特定样本库成员所接收的内容的识别和测量,样本库提供者可以通过使客户端设备首先登录到样本库提供者并且接收会话标识符,然后,使客户端设备将会话标识符传送到受众测量服务器,来向受众测量服务器注册用户。受众测量服务器可以将cookie或设备标识符传送到设备以便当传送内容标识符时使用。例如,图1D图示出根据这种实施方式,向受众测量服务器对样本库成员进行注册的系统的图。如所示出的,在步骤A处,客户端设备100可以向样本库提供者110登录、注册或认证自身。在步骤B处,样本库提供者110可以将会话标识符传送到客户端设备。在步骤C处,客户端设备可以将会话标识符传送到受众测量服务器114。在步骤D处,受众测量服务器114可以生成与会话标识符相对应的cookie或设备标识符101,并且将cookie或设备标识符101传送到客户端100,用于未来利用内容标识符的传送。受众测量服务器114可以保持会话标识符和相关联的cookie或设备标识符的记录,使得当受众测量服务器将内容标识符提供给样本库提供者110用于聚合或分析时,可以利用会话标识符识别内容标识符,并且因此,识别样本库成员。
[0052]在类似的实施方式中,为提高样本库的机密性,在步骤C处,会话标识符可以不被提供给受众测量服务器114;相反,设备100可以从受众测量服务器114简单地请求设备标识符101或cookie。在一些实施方式中,在步骤D处,一旦接收了设备标识符或cookie,客户端设备100可以将设备标识符或cookie传送到样本库提供者110。样本库提供者110可以将设备标识符或C O O k i e与被发送到客户端设备1 O的会话标识符或所生成的会话标识符相关联。一旦随后接收到内容标识符和设备标识符或cookie,样本库提供者110可以利用所存储的关联来识别哪些内容标识符对应于哪些设备100。
[0053]在未图示出的类似的实施方式中,被部署在客户端设备100和网络106之间的中间设备可以处理样本库提供者110的注册和传输、接收或对会话标识符、设备标识符或cookie的请求。这样的中间设备(诸如路由器或网关)可以被用来测量分发到样本库家庭或用户组,而不是单个用户或设备的内容。完成此操作以即降低系统的复杂性(避免在多个设备上安装收集代理)并增强样本库参与人员的个人隐私。在这样的实施方式中,中间设备可以执行图1D中所图示的步骤A-D中的一个或多个。
[0054]图2A中图示出的是客户端、样本库参与者或非样本库参与者的计算设备200的一种实施方式的框图,诸如客户端设备100。客户端设备200可以是任意数量的不同类型的用户电子设备,所述用户电子设备被配置为经由网络106通信,包括但不限于膝上型计算机、台式计算机、平板计算机、智能电话、数字视频录像机、电视的机顶盒、视频游戏机或任何其他类型和形式的计算设备或设备的组合。在一些实施方式中,客户端设备200的类型可以被分类为移动设备、台式设备或旨在保持静止或被配置为主要经由局域网访问网络106的设备,或另一类别的电子设备,诸如媒体消费设备。
[0055]在许多实施方式中,客户端设备200包括处理器202和存储器204。存储器204可以存储机器指令,所述机器指令当由处理器202执行时,致使处理器202执行本文中所述的操作中的一个或多个。处理器202可以包括微处理器、ASIC、FPGA等,或其组合。在许多实施方式中,处理器202可以是多核处理器或处理器阵列。处理器202可以包括但不限于电子、光学、磁或能够为处理器202提供程序指令的任何其他存储设备。处理器202可以包括软盘、CD-R0M、DVD、磁盘、存储器芯片、R0M、RAM、EEPR0M、EPR0M、闪速存储器、光学介质或处理器202能从其读取指令的任何其他适当的存储器。指令可以包括来自任何适当计算机编程语言的代码,所述计算机编程语言诸如但不限于C、C++、C#、Java、JavaScript、Per 1、HTML、XML、Python和Visual Basic。
[0056]客户端设备200可以包括一个或多个网络接口 206。网络接口 206可以包括任何类型和形式的接口,包括含1Base T、100Base T或100Base T( “Gigabit”)的以太网;802.11无线的变形中的任意,诸如802.11a、802.11b、802.1 lg、802.1 In或802.1 Iac ;蜂窝,包括CDMA、LTE、3G或4G蜂窝;蓝牙或其他短距离无线连接,或这些或用于与网络106通信的其他接口的任意组合。在许多实施方式中,客户端设备200可以包括不同类型的多个网络接口206,允许经由不同子网连接到各种网络106或诸如互联网的网络106。
[0057]客户端设备200可以包括一个或多个用户接口设备208。用户接口设备208可以是通过生成感觉信息(例如,显示器上的可视化、一种或多种声音、触觉反馈等),将数据传达给用户,和/或将从用户所接收的感觉信息转换成电子信号的任意电子设备(例如,键盘、鼠标、指示设备、触摸屏显示器、麦克风等)。根据各种实施方式,一个或多个用户接口设备可以在客户端设备200的壳体内部(诸如内置显示器、触摸屏、麦克风等等),或在客户端设备200的外部(诸如被连接到客户端设备200的监视器、被连接到客户端设备200的扬声器等)。
[0058]客户端设备200可以将应用210包括在存储器204中或可以利用处理器202执行应用210。应用210可以是用于接收内容和用于传送响应、命令或其他数据的应用、小应用、脚本、服务、后台程序、例程或其他可执行逻辑。在一种实施方式中,应用210可以是Web浏览器,而在另一实施方式中,应用210可以是视频游戏。应用210可以包括用于显示经由网络接口 206所接收的和/或由处理器202本地生成的内容,并且用于传输经由用户接口设备208所接收的交互的功能性,诸如对网站的请求、对调查响应选项的选择、输入文本串等。
[0059]在一些实施方式中,应用210可以包括数据收集器212。例如,数据收集器212可以包括用于收集由应用210所处理的数据的应用插件、应用扩展、子例程、浏览器工具栏、后台程序或其他可执行逻辑。在其他实施方式中,数据收集器212可以是与应用210分开但被配置为拦截和/或收集由应用210所处理的数据的单独的应用、服务、后台程序、例程或其他可执行逻辑,诸如屏幕截取器、分组拦截器、API挂钩过程或其他这样的应用。数据收集器212可以被配置为经由用户接口设备208拦截或接收数据输入,诸如互联网搜索查询、文本串、调查响应选择或其他值,或由应用210所接收和处理的数据,所述应用210包括访问过的网站、与网站或应用交互所花费的时间、读取的页面或其他这样的数据。在许多实施方式中,数据收集器212可以将该数据或这样的数据的标识符中的一些或全部存储在行为历史数据库或其他数据结构中,并且可以包括访问过的网站的识别、跟随的web链接、录入的搜索查询或其他这样的数据。在一些实施方式中,可以将该数据匿名或消除歧义以减小个人可识别信息。例如,数据收集器212可以识别与搜索查询对应的预定类别,诸如“欧洲旅游”或“旅行”并且记录与预定类别有关的搜索的指示,而不是记录输入的个人搜索查询,诸如查询“法国的度假场所”。在其他实施方式中,数据收集器212可以识别由客户端设备所接收的流式传输的多媒体内容,诸如电视节目、电影、歌曲、音乐视频或其他这样的内容。可以基于标识符标签来识别内容,所述标识符标签包括ID3标签或其他这样的元数据、统一资源定位符(URLs)或统一资源标识符(URIs)、文件名或所附内容的任何其他类型或形式的数据。在其他实施方式中,可以由服务器,或由部署在客户端和服务器之间的中间设备(诸如路由器、电缆调制解调器或其他这样的设备)来执行数据收集器212。例如,当请求和响应穿过路由器时,可以由在中间路由器上执行的数据收集器212解析数据请求和响应。在一些实施方式中,这可以允许对流向/来自家庭的所有数据流进行监控,而不要求将数据收集器212安装在家庭内的多个设备上。
[0060]客户端200可以包括设备标识符214或利用设备标识符214被识别。设备标识符214可以包括可以被用来将客户端200与其他客户端200区分开来的任何类型和形式的识别,包括但不限于MAC地址、文本和/或数值数据串、用户名、加密公钥、cookie、设备序列号、用户配置数据、网络地址或任何其他这样的标识符。在一些实施方式中,设备标识符214可以与一个或多个其他设备标识符214(例如,移动设备的设备标识符,家用计算机的设备标识符等)相关联。在许多实施方式中,,可以由样本库提供者或受众测量服务器生成设备标识符214和/或将设备标识符214传送到设备200,并且可以响应于请求或向样本库提供者成功登录、注册或认证来传送设备标识符214。因此,在一些实施方式中,客户端200可以包括由样本库提供者生成的会话标识符216。在其他实施方式中,如上面所讨论的,客户端200可以从受众测量服务器请求设备标识符或cookie 214,并且可以将设备标识符或cookie 214传送到样本库提供者,用于与设备和/或会话标识符相关联。在一些这样的实施方式中,可以由样本库提供者存储或维护会话标识符而不将其提供给设备。
[0061]现在参考图2B,图示出了结合图1A-1D所讨论的,计算设备或服务器218(诸如受众测量服务器114、内容提供者108或样本库提供者110)的实施方式的框图。正如客户端设备200,服务器218可以包括一个或多个处理器202、存储器204、网络接口 206和用户接口 208。在被称为无头服务器的一些实施方式中,服务器218可以不包括用户接口 208,但可以经由网络106,与具有用户接口 208的客户端200通信。存储器204可以包括内容存储232,诸如网页、图像、音频文件、视频文件、数据文件或任何其他类型和形式的数据的存储。在一些实施方式中,存储器204可以存储一个或多个应用210(未图示出),用于由服务器218的处理器202执行,所述服务器218包括FTP服务器、Web服务器、邮件服务器、文件共享服务器、对等服务器或用于分发在内容存储232中所存储的内容的其他这样的应用。
[0062]在一些实施方式中,服务器218可以执行测量引擎220。测量引擎220可以包括用于测量内容项的受众、包括接收内容标识符和/或设备标识符、根据设备标识符聚合或排序内容标识符、以及在时间段期间测量内容项的受众的应用、服务、服务器、后台程序、例程或其他可执行逻辑。例如,测量引擎可以对内容标识符的数量进行计数,所述内容标识符识别在一段时间(诸如小时)所接收的与有区别的设备标识符相关联的特定内容项,来计数所接收的内容项的受众的规模。该受众测量可以被提供给内容提供者、广告提供者、营销人员、分发者、分析人员或其他人。
[0063]在一些实施方式中,服务器218可以执行加密引擎222,有时根据用途被称为解密弓丨擎或加/解密引擎。加密引擎222可以包括用于加密数据的应用、服务、例程、服务器、后台程序或其他可执行逻辑。在一些实施方式中,加密引擎222可以包括加密硬件或与之交互。加密引擎222可以执行任何类型的加密和/或解密算法,包括各种高级加密标准(AES)算法、安全散列算法(SHA)或任何其他类型的对称加密。在其他实施方式中,加密引擎222可以执行任何其他类型的加密和/或解密,包括不对称加密方案、公钥加密方法、加密散列函数或任何其他类型和形式的密文或密码。在下述详细讨论的一些实施方式中,加密引擎222可以被用来加密从一个或多个客户端设备所接收的内容标识符以传送到样本库提供者。在这样的实施方式中,可以利用与设备相关联的设备标识符、cookie或会话标识符,来加密每个内容标识符。当在各种实施方式中,样本库提供者将了解其样本库成员的会话标识符、设备标识符或cookie时,样本库提供者将能够解密内容标识符用于聚合和分析,而不能解密与非样本库成员或不受该样本库提供者管理的其他样本库的成员相对应的任何数据。
[0064]在一些实施方式中,服务器218可以执行过滤器生成/应用模块226,其被不同地称为过滤器生成器、过滤器模块、过滤器或其他这样的名称。在一些实施方式中,过滤器生成器226可以生成识别由样本库提供者所提供的样本库的成员的设备标识符的概率数据结构。这样的结构可以包括布隆过滤器数组或商过滤器数组,或任何其他类型和形式概率数据结构,将在下文结合图5A和5B更详细地被描述。在许多实施方式中,可以由过滤器应用模块226应用该过滤器数组或数据结构来从测量数据库提取数据,诸如内容和设备标识符,以生成用来生成概率数据结构的与设备标识符相对应的数据的子集。在许多实施方式中,响应于由于将过滤器应用到不是样本库的部分的设备的设备标识符而导致的多次误报,过滤器还可以提取一些剩余数据部分。如上面所讨论的,在这样的实施方式中,可以由对应的设备或会话标识符加密每个内容标识符。因此,即使将与来自数组的误报相对应的数据提供给样本库提供者,样本库提供者可能不能成功地解密该数据。因此,受众测量服务器可以将包括样本库成员的数据中的所有加上一些非样本库成员的数据在内的数据集提供给样本库提供者,而不能识别哪些设备是样本库的一部分;以并且样本库提供者能够接收和解码样本库成员的数据中的所有,而不获得对非样本库成员的数据的访问。因此,在许多这样的实施方式中,多个样本库提供者可以利用相同受众测量系统而不会牺牲他们相应的的样本库的机密性并且不获得对彼此的数据的访问。
[0065]在一些实施方式中,服务器218可以维护测量数据库228和/或样本库成员数据库230。测量数据库228可以包括用于存储多个内容标识符及对应的设备标识符、cookie和/或会话标识符的任何类型和形式的数据库、平面文件、数据文件、数据数组或其他数据结构。在许多实施方式中,测量数据库228还可以包括所接收或传送的内容标识符的时间戳。
[0066]类似地,在一些实施方式中,样本库成员数据库230可以包括,用于识别和认证样本库成员并且将会话标识符和/或设备标识符或cookie与设备或设备组(诸如家庭中的设备)相关联的任何类型和形式的数据库、平面文件、数据文件、数据数组或其他数据结构。在一些实施方式中,样本库成员数据库230可以进一步包括样本库成员的帐户信息,包括用户或帐户名、登录密码或其他证书、设备类型或其他参数(例如,操作系统、Web浏览器类型或其他应用类型、网络连接类型或速度、地理位置等)。
[0067]在一些实施方式中,可以由受众测量服务器维护测量数据库228,而由样本库提供者维护样本库成员数据库230。在一些实施方式中,测量数据库228可以被存储在可由受众测量服务器和一个或多个样本库提供者访问的位置中。在其他实施方式中,受众测量服务器可以存储或维护测量数据库228,并且将该数据库或数据库228的一部分传送到样本库提供者。
[0068]如上结合图1D所讨论的,在许多实施方式中,当开始与在线内容的交互会话时,样本库成员可以注册或登录到样本库提供者。例如,一些样本库提供者向用户提供激励用于加入单一源样本库中,诸如商品的优惠券或折扣、免费服务或其他这样的诱惑。因此,样本库成员可以签约或选择加入以参与数据收集。在许多实施方式中,为保护参与者的隐私,数据收集可以是限制的或匿名的。为追踪参与,样本库提供者可以提供将在客户端设备上执行的客户端代理,诸如Web浏览器插件或应用,或客户端设备可以向样本库登录或注册与样本库的会话。在一些实施方式中,会话可以是有时间限制,并且在预定时间后自动失效,而在其他实施方式中,客户端设备可以传送启动会话的第一通信和终止会话的第二通信。
[0069]图3A是根据一种实施方式,用于向受众测量服务器注册样本库成员的过程的一种实施方式的信号流图。如所示出的,样本库成员300的样本库客户端或客户端设备可以经由一个或多个网络106(未示出),与样本库提供者302的设备或服务器以及受众测量服务器304通信。在步骤310处,样本库客户端300可以向样本库提供者302传送通信以登录。在未图示出的一些实施方式中,步骤310可以包括多个请求和响应通信,诸如安全登录页面的请求和安全登录页面的响应;经由用户名和/或密码登录的请求和指示成功(或在未正确输入的情况下,失败)的响应;等。在一些实施方式中,样本库客户端300的用户可以录入一个或多个参数或证书用于登录,诸如帐户或用户名或密码,而在其他实施方式中,样本库客户端300可以向样本库提供者302提供标识符以登录(例如,MAC地址、所存储的帐号、证书等)。
[0070]在一些实施方式中,样本库提供者302可以认证样本库客户端300并且在步骤312处,生成会话标识符并且将其传送到样本库客户端300。会话标识符可以包括字母数字串或任何类型和形式的其他标识符。如上面所讨论的,会话标识符可以包括失效时间或被设定为在预定时间段后自动失效。在许多实施方式中,样本库提供者302可以存储将生成的会话标识符与样本库客户端300关联的记录或样本库客户端300的登录证书。在一些这样的实施方式中,当样本库提供者随后从测量服务器304接收具有内容标识符的被聚合的测量数据和对应的会话标识符时,测量服务器304能够利用特定样本库客户端设备、家庭、或个人参与者的标识符替代会话标识符。因此,多个会话标识符可以与单个设备相关联,允许追踪跨不同会话或在比单次会话更长的时间段上对内容的接收的不同。
[0071]在一些实施方式中,在步骤314处,样本库客户端300可以将会话标识符传送到测量服务器304。如上面所讨论的,会话标识符可以包括失效时间或被设定为在预定时间段后自动失效。在许多实施方式中,在步骤316处,测量服务器304可以生成cookie或设备标识符(例如,另一字母数字串),并且将cookie或设备标识符传送到样本库客户端。在许多实施方式中,测量服务器304可以存储经由设备标识符或cookie,将会话标识符与样本库客户端300相关联的记录。在一些这样的实施方式中,测量服务器304可以经由被包括在与内容标识符的通信中的设备标识符或cookie,将从样本库客户端300所接收的内容标识符与会话标识符相关联。测量服务器304随后聚合与它们的对应会话标识符相关联的内容标识符和/或将其提供给样本库提供者302。
[0072]在其他实施方式中,如上面所讨论的,在步骤314处,样本库客户端300可以不将会话标识符传送到测量服务器304,而是替代地传送对cookie或设备标识符的请求。在一些实施方式中,cookie或设备标识符可以由客户端设备(和/或受众测量服务器)传送给样本库提供者。这可以提供样本库成员信息的增强的机密性:因为样本库提供者可以使用序列会话标识符或具有唯一格式的会话标识符,如果序列中的多个会话标识符或具有与多个客户端设备类似的格式,服务器能够确定客户端设备是相同样本库的全部部分。因此,通过不向受众测量服务器提供任何这样的信息,服务器仅能够确定客户端设备是一些样本库的成员,但不知道该特定样本库或样本库提供者。
[0073]在一些其他实施方式中,可以跳过步骤314和316,并且可以由样本库提供者或样本库客户端生成设备标识符或cookie,或可以将会话标识符用作第三方cookie或标识符。例如,响应于接收内容项,样本库客户端可以将通信传送到测量服务器,所述测量服务器包括内容标识符和会话标识符或客户端的标识符(例如,MAC地址、IP地址、GUID、预定随机数串等)。测量服务器可以确定是否接收到包括客户端的相同标识符或会话标识符的在先通信,如果是,将通信与这样的在先通信聚合。如果不是,测量服务器可以将用于新接收的会话标识符或客户端标识符的新条目添加到测量数据库。
[0074]cookie、设备标识符或会话标识符可以被用来在将数据提供给样本库提供者前,加密测量数据。完成此操作以增加所传送的数据被拦截的安全性并且为样本库成员提供增强的机密性。因为一些样本库提供者要求机密性,因此,提供者不需要向受众测量服务器识别他们的样本库成员。图3B是根据一种实施方式,经由受众测量服务器,用于安全和机密受众测量的过程的一种实施方式的信号流图。在步骤322处,样本库客户端300可以从内容提供者320接收内容。如上面所讨论的,内容可以包括音频、视频、多媒体、动画、文本、HTML、可执行代码或其他数据。内容可以包括在步骤324处,致使样本库客户端300将内容的识别和cookie、会话标识符或设备标识符传送到测量服务器304的嵌入式命令。如上面所讨论的,嵌入式命令可以包括具有测量服务器的URL的HTML頂AG标签、链接内的HTML PING标签、诸如Javascript命令的可执行脚本,或任何其他这样的命令。内容标识符和cookie、会话标识符或设备标识符可以被发送为请求内的参数(诸如URL内的参数、POST请求的参数或任何其他类型和形式的请求)、可以被包括在请求的报头中(例如,在TCP选项字段中或传输层、会话层、应用层、网络层或网络通信的任何其他这样的层的的报头的任何其他部分),或可以被提供给测量服务器。
[0075]内容标识符可以由受众测量服务器存储和跟踪或通过受众测量服务器,与所接收的cookie、设备标识符或会话标识符相关联,并且可以按所述cookie、设备标识符或会话标识符分组或聚合。在许多实施方式中,尽管仅示出了一个客户端和通信,但测量服务器304可以与多个客户端300通信并且从其接收测量数据。为检索测量数据,样本库提供者302可以经由其自己的样本库成员的cookie、设备标识符或会话标识符的散列,来生成概率数据结构,诸如布隆过滤器或商过滤器数组或其他数据结构,其中,误报匹配是可能的,但漏报不能。在步骤326处,样本库提供者可以将数组提供给受众测量服务器,其可以利用过滤器来提取包括样本库成员的数据在内的测量数据的子集,以及作为误报的一些非样本库成员的数据。在步骤328处,受众测量服务器可以利用对应于数据项的每个cookie、设备标识符或会话标识符,来加密所提取的数据的子集作为密钥,并且将经加密的数据发送到样本库提供者,因此包括样本库和一些非样本库数据。样本库提供者可以尝试使用与样本库成员相关联的cookie、设备标识符或会话标识符,来解密每个所接收的数据项。因为样本库提供者仅知道其自己的样本库成员的标识符或cookie,而不知道竞争者的样本库的成员的标识符或cookie,样本库提供者将仅能够成功地解密其自己的样本库数据,而不能解密对应于非成员的数据。因此,受众测量服务器的样本库成员保持机密性,而仅向样本库提供者提供对其自己的样本库的数据的访问。
[0076]如上面所讨论的,在许多实施方式中,样本库提供者302可以经由其自己的样本库成员的cookie、设备标识符或会话标识符,来生成概率数据结构,诸如布隆过滤器或商过滤器数组或其他数据结构,其中,误报匹配是可能的,但漏报不可能。图4A是根据一种实施方式,用于过滤受众测量数据的概率数据结构的生成的示例的图。可以经由散列算法402,散列一个或多个会话标识符、cookie、设备标识符或其他数据串400A-400N(统称为标识符400)以生成与散列结果404A-404N(统称为结果404)对应的集合。可以在步骤406处组合散列结果404以创建包括每个散列结果在内的概率数据结构408。
[0077]散列算法402可以包括多个不同散列函数,使得每个散列函数将标识符400映射到不同值。例如,在图4A中所图示的实施方式中,散列算法402包括将每个标识符400映射到结果404中的不同值的三个散列函数,导致用于每个标识符400的结果数组内的三个“命中”。在一些实施方式中,可以使用不同数量的散列函数,或散列函数可以是相同函数,但具有被添加到标识符400的不同散列盐(salt)或数据用于散列。因此,组合的数据结构408包括用于每个标识符400的散列函数的每个结果的标识符。如所示出的,在许多实施方式中,如果标识符400的散列函数输出对应的数组位置,数据结构可以包括具有设定为预定值(例如,O或I)的位的位串。在其他实施方式中,数据结构可以包括具有匹配散列函数结果和不匹配散列函数结果的数组位置之间的区别的值或其他数据的数组。
[0078]图4B是根据一种实施方式,对用于过滤受众测量数据的概率数据结构的使用的示例的图。受众测量服务器可以具有包括样本库参与者400的多个cookie、设备标识符或会话标识符(例如,会话标识符1400A)的测量数据的数据库。类似地,数据库还可以包括非样本库参与者410的c ο ο k i e、设备标识符或会话标识符(例如,非成员会话标识符I 410 A和2410B)的测量数据,通称为非成员标识符410。测量服务器可以将散列算法402应用于每个标识符400,410来生成样本库参与者标识符400的对应的散列结果404,以及非成员标识符410的散列结果412 (例如,散列结果412A-412B)。
[0079]在步骤414处,一旦从样本库提供者接收了概率数据结构408,受众测量服务器可以将每个散列结果404,412与数据结构408比较。如果散列结果404,412中的每个所识别的数组位置都被包括在数据结构408中,那么可以将对应的标识符400,410 (以及对应的内容标识符)包括在提供给样本库提供者的数据的子集中。然而,如果散列结果412中所识别的数组位置中的任何一个未包括在数据结构408中,那么对应的标识符410必须是明确不是样本库的成员的设备:如果是,那么散列函数仅能导致在数据结构408中所识别的位置。因此,在受众测量服务能够确定哪些成员在样本库中,哪些成员不在样本库中的情况下,通过将数据结构408与散列结果404,412比较,受众测量服务器可以提取包括来自所有样本库成员的测量数据以及来自非样本库成员的随机部分的数据的测量数据的子集。
[0080]如上面所讨论的,只要提取或选择数据的子集以提供给样本库提供者,通过其对应的会话标识符、设备标识符或cookie,加密每个内容标识符或数据项。可以将经加密的数据提供给样本库提供者。因为样本库提供者将具有其样本库成员的会话标识符、设备标识符或cookie,但不具有非样本库成员的这样的标识符,样本库提供者将仅能够成功地解密与样本库成员的标识符对应的内容标识符。因此,样本库提供者可能不能利用与非样本库参与者对应的数据。
[0081]图5是根据一种实施方式,经由受众测量服务器,在用于受众测量的过程500的一种实施方式中采取的步骤的流程图。在步骤502处,受众测量服务器可以从客户端设备接收通信,所述通信包括内容标识符和客户端设备。如上面所讨论的,通信可以包括对来自受众测量服务器的内容的请求,诸如对逐个像素图像的请求,例如,识别推荐页面的内容标识符。在其他实施方式中,通信可以包括对内容的请求,并且在步骤506处,受众测量服务器可以响应于到内容提供者的重定向,同时将该请求记录为将被分发到客户端设备的内容的识另O。在其他实施方式中,经由数据结构或应用编程接口或任何其他这样的方法,内容标识符和/或客户端标识符可以被提供为分组的报头中的请求的参数。如上面所讨论的,客户端标识符可以包括由样本库提供者或由受众测量服务器所生成的设备标识符、会话标识符或cookie并且在注册过程期间被提供给客户端。在一些实施方式中,通信可以包括其他信息,诸如推荐页面、搜索查询、时间戳或任何其他类型和形式的信息。
[0082]在步骤504处,在一些实施方式中,受众测量服务器可以将标识符添加到测量数据库。在一些实施方式中,数据库可以包括内容标识符和客户端标识符对,而在其他实施方式中,数据库可以包括与客户端标识符对应的内容标识符的集合。在这样的实施方式中,当利用先前所接收的客户端标识符,接收新的内容标识符时,将它们添加到用于所述客户端标识符的集合。在通信中所接收的其他信息可以被添加到数据库,包括时间戳、推荐页面、搜索查询或任何其他这样的信息。
[0083]如所示出的,在许多实施方式中,可以对来自客户端的多个通信或来自多个客户端的多个通信,重复步骤502和504。接着,在步骤508处,受众测量服务器可以从样本库提供者接收对样本库的成员的受众数据的请求。请求可以包括通过所请求的样本库的成员的客户端标识符的散列计算出的概率数据结构,诸如布隆过滤器或商过滤器数组,如上结合图4A-4B所讨论的。
[0084]在步骤510处,根据概率数据结构,受众测量服务器可以过滤、选择或提取测量数据的子集。如上面所讨论的,提取数据可以包括将测量数据库中的每个客户端标识符的散列与数据结构比较,并将具有包括在数据结构中的散列结果的客户端标识符包括在子集中,并且从子集排除具有不包括在数据结构中的散列结果的客户端标识符。在一些实施方式中,例如,可以在步骤504处,将散列预先计算,并且存储在测量数据库中,或用作数据库中的索引值。
[0085]在步骤512处,受众测量服务器可以加密提取的子集中的每个内容标识符,所述内容标识符具有利用内容标识符所接收的对应的客户端标识符。受众测量服务器可以使用任何类型和形式的对称加密,其中,客户端标识符可以是加密和解密密钥两者。在一些实施方式中,尽管示出为在步骤510后,但步骤512可以在步骤504前后执行。例如,受众测量服务器可以将加密形式的每个内容标识符存储在数据库内,潜在地降低对不同样本库数据请求重复地加密值的需要。
[0086]在步骤514处,响应于508处的请求,可以将数据的加密子集传送给样本库提供者。如上面所讨论的,子集将包括与样本库成员的客户端标识符对应的内容标识符,以及与由过滤器生成的误报导致的非样本库成员的客户端标识符对应的一些内容标识符。因为样本库提供者将不具有这些后续客户端标识符,因此,样本库提供者将仅能够解密与其自己的样本库成员对应的内容标识符。
[0087]因为上面所讨论的系统和方法不要求安装客户端代理,因此,受众测量服务器能够记录来自内容项的所有查看者的内容标识符和客户端标识符。例如,可以将内容项提供为网页中的被嵌入或链接元素,并且一旦对页面进行呈现或对链接进行选择,客户端设备可以将请求传送到受众测量服务器。因此,在这样的实施方式中,受众测量服务器可能能够测量总的受众查看内容。在进一步的实施方式中,可以使用该总的受众测量来验证单一源样本库的准确度。例如,如果受众测量服务器确定大量受众正查看内容项(例如,特别是流行的病毒视频),而单一源样本库仅包括内容的非常少数的查看者,通过单一来源样本库数据生成的内容的受众的统计预测可能非常低。可以将该预测与总的测量数据比较并且用该预测来识别样本库可能不表示受众群体的准确样本。在类似的实施方式中,可以将来自总受众的由受众测量服务器所接收的Pings或测量数据的一部分(例如,1%,包括样本库或非样本库成员数据)转发或重定向到样本库提供者,使得样本库提供者可以将几乎总受众的统计测量与来自其样本库成员数据的预测测量比较。
[0088]如上面所讨论的,在许多这样的实施方式中,可以对所收集的数据进行匿名或消除歧义以保护隐私,特别是对不是样本库参与者的个人。在许多这样的实施方式或类似的情形中,其中,与客户端设备的用户有关的个人信息可以被收集用于测量或用来选择第三方内容,可以为用户提供控制可以收集个人信息的程序或特征(例如,与用户的社交网络有关的信息、社交动作或活动、用户的偏好或用户的当前位置)是否这样做的机会,,或控制是否或如何将测量数据传送到受众测量服务器和/或样本库提供者的机会。此外,在由受众测量服务器存储或使用前,可以以一种或多种方式处理某些数据,使得当生成参数(例如,人口统计参数)时移除个人标识信息。例如,可以将用户的身份匿名,使得不能确定用户的个人标识信息,或可以泛化获得位置信息的用户的地理位置(诸如市、邮政编码或州级别),使得不能确定用户的特定位置。因此,用户可以控制如何收集和由受众测量服务器、样本库提供者和内容提供者使用的与他或她有关的信息。
[0089]在本说明书中所述的主题和操作的实施方式可以以下列方式来实现:数字电子电路、或者计算机软件、固件或硬件,包括在本说明书中公开的结构及其结构等价物、或者以上中的一个或多个的组合。可以将在本说明书中所述的主题的实施方式实现为一个或多个计算机程序,即计算机程序指令的一个或多个模块,所述计算机程序指令被编码在一个或多个计算机存储介质上供数据处理装置执行或控制数据处理装置的操作。替选地或另外地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电子的、光学的、电磁信号,其被生成以编码信息用于传输到合适的接收机装置供数据处理装置执行。计算机存储介质可以是下述或被包括在下述中:计算机可读存储设备、计算机可读存储基片、随机或连续存取存储器阵列或设备、或以上的一个或多个的组合。此外,尽管计算机存储介质不是传播信号,计算机存储介质可以是被编码在人工生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质还可以是下述或被包括在下述中:一个或多个单独组件或介质(例如,多个CD、盘或其他存储设备)。因此,计算机存储介质可以是有形的。
[0090]可以将在本说明书中所述的操作实现为由数据处理装置对存储在一个或多个计算机可读存储设备上或从其他源所接收的数据执行的操作。
[0091]术语“客户端”或“服务器”包括用于处理数据的各种各样的装置、设备以及机器,通过示例的方式包括:可编程处理器、计算机、片上系统、或前述中的多个或多个的组合。装置可以包括专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASICX专用集成电路)。除硬件夕卜,装置还可以包括为讨论中的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时间环境、虚拟机、或以上一个或多个的组合的代码。装置和执行环境可以实现各种不同的计算模型基础设施,诸如web服务、分布式计算和网格计算基础设施。
[0092]计算机程序(也被称作程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,包括编译或解释型语言、说明或过程语言,并且其可以以任何形式部署,包括适于在计算环境中使用的作为独立程序或作为模块、组件、子程序、对象或其他单元。计算机程序可以但不必与文件系统中的文件对应。可以将程序存储在保持其他程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的一部分中、在专用于讨论中的程序的单个文件或者多个协调文件(例如,存储一个或多个模块、子程序、或部分代码的部分的文件)中。可以将计算机程序部署为在一个计算机上或者在位于一个地点或跨多个地点分布并且通过通信网络互连的多个计算机上执行。
[0093]在本说明书中所述的过程和逻辑流乘可以由执行一个或多个计算机程序的一个或多个可编程处理器执行以通过操作输入数据并且生成输出来执行动作。过程和逻辑流程还可以由专用逻辑电路执行,并且装置还可以实现为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASICX专用集成电路)。
[0094]适于执行计算机程序的处理器作为示例包括通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。一般地,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的必要元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储器设备。一般地,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘,或操作地被耦接以从所述一个或多个大容量存储设备接收数据或向所述一个或多个大容量存储设备传递数据或两者。然而,计算机不必具有这样的设备。此外,可以将计算机嵌入另一个设备中,所述设备例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏机、全球定位系统(GPS)接收器或便携式存储设备(例如,通用串行总线(USB)闪速存储器驱动),仅列出一些。适于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,以示例的形式包括:半导体存储器设备,例如EPROM、EEPROM和闪速存储器设备;磁盘,例如内部硬盘或可移除盘;磁光盘;以及⑶-ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充,或被合并在专用逻辑电路中。
[0095]为了提供与用户的交互,在本说明书中所述的主题的实施方式可以在计算机上实现,所述计算机具有用于向用户显示信息的显示设备,例如CRT(阴极射线管)、LCD(液晶显示器)、0LED(有机发光二极管)、TFT(薄膜晶体管)、等离子、其他灵活配置或任何其他显示器;以及用户通过其可以向计算机提供输入的键盘和指示设备,例如鼠标或轨迹球等,或触摸屏、触摸板等。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感知反馈,例如视觉反馈、听觉反馈或触觉反馈;以及可以以任何形式接收来自用户的输入,包括声学的、语音的或触觉的输入。另外,计算机可以通过将文档发送给用户所使用的设备并且从用户所使用的设备接收文档来与用户交互;例如,通过响应于从用户的客户端设备上的web浏览器所接收的请求将网页发送给该web浏览器。
[0096]在本说明书中所述的主题的实施方式可以在包括下述的计算系统中实现:后端组件,例如作为数据服务器;或者中间件组件,例如应用服务器;或者前端组件,例如具有用户通过其可以与在本说明书中所述的主题的实现交互的图形用户界面或Web浏览器的客户端计算机;或者一个或多个这样的后端、中间件或前端组件的任何组合。系统的组件可以通过例如通信网络的数字数据通信的任何形式或介质互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互联网络(例如,互联网)以及对等网络(例如,对等点对点网络)。
[0097]在本文中所公开的特征可以在智能电视模块上实现(或所连接的电视模块、混合电视模块等),其可以包括被配置为将因特网连接性与(例如,经由有线、卫星、空中或其他信号所接收的)更多传统电视节目源集成的处理电路。智能电视模块可以是被物理地合并入电视机或者可以包括单独的设备,诸如机顶盒、蓝光或其他数字媒体播放器、游戏机、宾馆电视系统以及其他配套设备。智能电视模块可以被配置为允许查看者搜索并且找到视频、电影、相片以及在web上、在本地有线电视频道、在卫星电视频道或存储在本地硬件驱动上的其他内容。机顶盒(STB)或机顶单元(STU)可以包括信息电器设备,该信息电器设备可以包含调谐器并且连接到电视机以及外部信号源,将信号转变为内容,该内容之后将会被显示在电视屏幕或其他显示设备上。智能电视模块可以被配置为提供主屏幕或顶级屏幕,所述主屏幕或顶级屏幕包括用于诸如web浏览器和多个流媒体服务的多个不同应用、所连接的电缆或卫星媒体源、其他web “频道”等的图标。智能电视模块可以进一步被配置为向用户提供电子节目指南。对于智能电视模块的配套应用可以在移动计算设备上是可操作的以向用户提供与可获得的节目有关的附加信息、以允许用户控制智能电视模块等。在替选的实施例中,可以在膝上型计算机或其他个人计算机、智能电话、其他移动电话、手提计算机、平板计算机或其他计算设备上实现所述特征。
[0098]虽然本说明书包含许多【具体实施方式】细节,但是这些细节不应当被解释为对任何发明或要求保护的范围的限制,而应当被解释为对特定于特定发明的特定实施方式的特征的描述。还可以将在单独的实施方式的场境中的本说明书中所描述的某些特征以组合的形式在单个实施方式中实现。相反地,也可以使在单个实施方式的场境中所描述的各种特征分离地在多个实施方式中实现或在任何适当的子组合中实现。此外,尽管可能在上面将特征描述为在某些组合中起作用,甚至最初要求这样的保护,但是可以在一些情况下,将来自所要求保护的组合的一个或多个特征从该组合中删去,并且所要求保护的组合可以针对子组合或子组合的变体。
[0099]类似地,虽然在附图中按照特定顺序描绘了操作,然而,不应当将这理解为需要按照所示的特定顺序或按照连续顺序执行这样的操作、或者需要执行所有图示的操作,才能达到期望的结果。在某些情况下,多任务以及并行处理可以是有利的。此外,不应当将在上述实施方式中的各种系统组件的分离理解为在所有实施方式中均需要这样的分离,而应当理解,通常可以将所述程序组件和系统集成到一起成在单个软件产品中或被封装在多个软件产品内。
[0100]因此,已描述了本主题的特定实施方式。其他实施方式在所附权利要求的范围内。在一些情况下,可以按照不同的顺序来执行权利要求中记载的动作并且仍然达到期望的结果。另外,在附图中描绘的过程不一定要求所示的特定顺序或连续顺序,才能达到期望的结果。在某些实施方式中,多任务以及并行处理可以是有利的。
【主权项】
1.一种用于安全在线受众测量的方法,包括: 由第一设备所执行的受众测量服务器,接收从多个客户端设备中的每个客户端设备所传送的通信,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作; 由所述受众测量服务器从第二设备接收对所述样本库测量服务的所述成员的测量数据的请求,所述请求包括与所述多个客户端设备的所述第一部分的每个设备标识符的散列对应的概率数据结构; 由所述受众测量服务器,经由所述概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括所述多个客户端设备的所述第一部分的设备标识符在内的通信,以及(ii)包括不与样本库成员对应的所述多个客户端设备的第二部分的设备标识符在内的通信; 对所选择的子集中的每个通信,由所述受众测量服务器利用每个所述通信中的对应的设备标识符,加密所述内容项的所述识别以产生经加密的测量数据;以及 由所述受众测量服务器将经加密的测量数据传送到所述第二设备。2.如权利要求1所述的方法,其中,响应于所述客户端设备从内容提供者接收所述内容项,传送从所述多个客户端设备中的客户端设备所传送的每个通信。3.如权利要求1所述的方法,其中,所述第二设备成功地解密与所述多个客户端设备的所述第一部分的设备标识符对应的内容项的识别,并且不能解密不与所述多个客户端设备的所述第一部分的设备标识符对应的内容项的识别。4.如权利要求1所述的方法,其中,由每个客户端设备所接收的所述内容项包括:使所述客户端设备将通信传送到所述第一设备的命令。5.如权利要求1所述的方法,其中,所述多个客户端设备的所述第一部分中的客户端设备的所述设备标识符是由所述样本库测量服务生成的。6.如权利要求1所述的方法,进一步包括: 由所述受众测量服务器从客户端设备接收对设备标识符的请求; 由所述受众测量服务器生成所述设备标识符;以及 由所述受众测量服务器将所述设备标识符传送到所述客户端设备,所述设备标识符是由所述客户端设备响应于所述设备代表所述样本库测量服务的成员来操作,而提供给所述样本库测量服务的。7.如权利要求1所述的方法,其中,所述概率数据结构包括布隆过滤器。8.如权利要求1所述的方法,其中,所述概率数据结构包括商过滤器。9.如权利要求1所述的方法,其中,过滤所接收的通信来选择所接收的通信的子集进一步包括: 确定通信的所述设备标识符的散列与所述概率数据结构的一部分匹配;以及 响应于对所述设备标识符的所述散列与所述概率数据结构的所述部分匹配的确定,将所述通信包括在所选择的子集中。10.如权利要求1所述的方法,其中,过滤所接收的通信来选择所接收的通信的子集进一步包括: 确定通信的所述设备标识符的散列与所述概率数据结构的一部分不匹配;以及 响应于对所述设备标识符的所述散列与所述概率数据结构的一部分不匹配的确定,从所选择的子集中排除所述通信。11.一种用于安全在线受众测量的系统,包括: 与多个客户端设备通信的第一设备,包括处理器和存储器,所述处理器被配置为:接收从所述多个客户端设备中的每个客户端设备所传送的通信,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作; 从第二设备接收对所述样本库测量服务的所述成员的测量数据的请求,所述请求包括与所述多个客户端设备的所述第一部分的每个设备标识符的散列对应的概率数据结构; 经由所述概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括所述多个客户端设备的所述第一部分的设备标识符在内的通信,以及(ii)包括不与样本库成员对应的所述多个客户端设备的第二部分的设备标识符在内的通信;对所选择的子集中的每个通信,利用每个所述通信中的对应的设备标识符,加密所述内容项的所述识别以产生经加密的测量数据;以及将经加密的测量数据传送到所述第二设备。12.如权利要求11所述的系统,其中,响应于所述客户端设备从内容提供者接收所述内容项,传送从所述多个客户端设备中的客户端设备所传送的每个通信。13.如权利要求11所述的系统,其中,所述第二设备成功地解密与所述多个客户端设备的所述第一部分的设备标识符对应的内容项的识别,并且不能解密不与所述多个客户端设备的所述第一部分的设备标识符对应的内容项的识别。14.如权利要求11所述的系统,其中,由每个客户端设备所接收的所述内容项包括:使所述客户端设备将通信传送到所述第一设备的命令。15.如权利要求11所述的系统,其中,所述多个客户端设备的所述第一部分中的客户端设备的所述设备标识符是由所述样本库测量服务生成的。16.如权利要求11所述的系统,其中,所述处理器被进一步配置为: 从客户端设备接收对设备标识符的请求; 生成所述设备标识符;以及 将所述设备标识符传送到所述客户端设备,所述设备标识符是由所述客户端设备响应于所述设备代表所述样本库测量服务的成员来操作,而提供给所述样本库测量服务的。17.如权利要求11所述的系统,其中,所述概率数据结构包括布隆过滤器或商过滤器。18.如权利要求11所述的系统,其中,所述处理器被进一步配置为: 确定通信的所述设备标识符的散列与所述概率数据结构的一部分匹配;以及响应于对所述设备标识符的所述散列与所述概率数据结构的所述部分匹配的确定,将所述通信包括在所选择的子集中。19.如权利要求11所述的系统,其中,所述处理器被进一步配置为: 确定通信的所述设备标识符的散列与所述概率数据结构的一部分不匹配;以及响应于对所述设备标识符的所述散列与所述概率数据结构的一部分不匹配的确定,从所选择的子集中排除所述通信。20.—种存储指令的计算机可读存储介质,所述指令当由一个或多个数据处理器执行时,致使所述一个或多个数据处理器执行操作,所述操作包括: 接收从多个客户端设备中的每个客户端设备所传送的通信,每个通信包括内容项的识别和该客户端设备的设备标识符,所述多个客户端设备的第一部分代表样本库测量服务的成员来操作; 从第二设备接收对所述样本库测量服务的所述成员的测量数据的请求,所述请求包括与所述多个客户端设备的所述第一部分的每个设备标识符的散列对应的概率数据结构; 经由所述概率数据结构,过滤所接收的通信以选择所接收的通信的子集,所接收的通信包括(i)包括所述多个客户端设备的所述第一部分的设备标识符在内的通信,以及(ii)包括不与样本库成员对应的所述多个客户端设备的第二部分的设备标识符在内的通信;对所选择的子集中的每个通信,利用每个所述通信中的对应的设备标识符,加密所述内容项的所述识别以产生经加密的测量数据;以及将经加密的测量数据传送到所述第二设备。
【文档编号】H04L29/06GK105850100SQ201480071094
【公开日】2016年8月10日
【申请日】2014年3月11日
【发明人】雷蒙多·米里索拉, 奥利弗·托马斯·盖伊蒙德, 安德拉斯·奥尔班, 雷托·施特勒布尔
【申请人】谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1