用于Web跟踪器分类和缓解的系统和方法与流程

文档序号:33231978发布日期:2023-02-14 19:25阅读:37来源:国知局
用于Web跟踪器分类和缓解的系统和方法与流程
用于web跟踪器分类和缓解的系统和方法


背景技术:

1.web跟踪器是已知的在用户浏览的同时收集用户的数据的代码片段,通常记录它并使用它来将用户与个性化广告对准。当今的各种浏览器都支持跟踪预防实现,以保护用户免受web上已知跟踪器的侵害。这是通过限制跟踪器对基于浏览器的存储(诸如cookie)的访问来实现的,防止它们存储用于跨web跟踪用户的每用户标识符。虽然这样的保护有助于保护用户隐私,但它们可能会触发与跟踪实体的军备竞赛。这些跟踪器可能会尝试各种方法,通过改变域名或使用国际市场中的本地交付点来破坏跟踪预防系统,以避免被发现。此外,存储访问限制还可能引起与期望这样的跟踪器以不受限制的存储访问操作的站点的兼容性问题。


技术实现要素:

2.本发明内容被提供以以简化形式介绍概念的选择,这些概念将在下面的具体实施方式中进一步描述。本发明内容并非旨在标识所要求保护的主题的关键特征或基本特征,也不旨在用于限制所要求保护的主题的范围。
3.方法、系统、装置和计算机可读存储介质被描述用于以隐私保护方式对web跟踪器进行智能分类并缓解这样的web跟踪器的影响。当用户浏览web并遇到各种web站点时,跟踪器相关的度量针对这些web站点被确定。这些度量被模糊以保护用户的隐私。度量通过使用动态和不可知的数量两者将度量缩放(scale)到用户的浏览历史来模糊。经模糊的度量被提供作为对机器学习模型的输入,该机器学习模型被配置为输出与由用户访问的web站点相关联的web跟踪器的分类。取决于分类,web跟踪器的影响被缓解。例如,web跟踪器的网络和/或存储请求可能会受到限制。针对特定web跟踪器的限制可能会基于用户关于跟踪器的相关联web站点的用户参与度的水平而放宽。例如,如果用户参与度的水平相对较高,则对web跟踪器的限制被放宽。通过这样做,对于对用户相对重要的web站点,与跟踪预防相关联的兼容性风险被缓解。
4.下面参照附图详细描述实施例的其他特征和优点,以及各种实施例的结构和操作。注意,方法和系统不限于本文描述的特定实施例。这些实施例在本文中仅出于说明性目的而呈现。基于本文包含的教导,其他实施例对于(多个)相关领域的技术人员将是明显的。
附图说明
5.并入本文并形成说明书的一部分的附图说明了本技术的实施例,并与说明书一起进一步用于解释实施例的原理,并使相关领域的技术人员能够做出并使用实施例。
6.图1示出了根据示例实施例的用于对web跟踪器进行分类并缓解经分类的web跟踪器的影响的系统的框图。
7.图2示出了根据示例实施例的用于对web跟踪器进行分类的系统的框图。
8.图3示出了根据示例实施例的用于分类和缓解web跟踪器的影响的方法的流程图。
9.图4示出了根据示例实施例的用于生成机器学习模型的方法的流程图。
10.图5示出了根据示例实施例的用于生成机器学习模型的系统的框图。
11.图6示出了根据示例实施例的用于缓解web跟踪器的影响的系统的框图。
12.图7示出了根据示例实施例的用于缓解web跟踪器的影响的方法的流程图。
13.图8是其中可以实现实施例的示例性用户设备的框图。
14.图9是可以用于实现各种实施例的示例基于处理器的计算机系统的框图。
15.本文描述的实施例的特征和优点将在结合附图时从以下阐述的具体实施方式中变得更加明显,其中相似的附图标记自始至终标识对应的元素。在附图中,相似的附图标记通常指示相同的、功能相似的和/或结构相似的元素。元素首次出现的附图由对应附图标记中最左边的(多个)数字指示。
具体实施方式
16.i.介绍
17.以下具体实施方式公开了许多示例实施例。本专利申请的范围不限于公开的实施例,还包括公开的实施例的组合,以及对公开的实施例的修改。
18.在说明书中对“一个(one)实施例”、“一个(an)实施例”、“一个示例实施例”等的引用指示所描述的实施例可以包括特定的特征、结构或特性,但是每个实施例都可以不一定包括特定的特征、结构或特性。此外,这些短语不一定指相同的实施例。此外,当结合实施例描述特定特征、结构或特性时,认为在本领域技术人员的知识范围内实现与其他实施例结合的这种特征、结构或特性,无论是否明确描述。
19.在讨论中,除非另有说明,形容词如“基本上”和“大约”修饰本公开实施例的一个或多个特征的条件或关系特性,应理解为表示条件或特性被定义在对于其预期应用的实施例的操作可接受的公差范围内。
20.许多示例性实施例描述如下。注意,本文提供的任何章节/小节标题并非旨在限制。贯穿本文档描述了实施例,并且任何类型的实施例可以包括在任何章节/小节下。此外,在任何章节/小节中公开的实施例可以以任何方式与在相同章节/小节和/或不同章节/小节中描述的任何其他实施例相组合。
21.ii.示例实施例
22.本文描述的实施例针对以隐私保护方式对web跟踪器进行智能分类并缓解这样的web跟踪器的影响。当用户浏览web并遇到各种web站点时,跟踪器相关的度量针对这些web站点被确定。这些度量被模糊以保护用户的隐私。度量通过使用动态和不可知的数量两者将度量缩放到用户的浏览历史被模糊。经模糊的度量被提供作为对机器学习模型的输入,该机器学习模型被配置为输出用于与由用户访问的web站点相关联的web跟踪器的分类。取决于分类,web跟踪器的影响被缓解。例如,web跟踪器的网络和/或存储请求可能会受到限制。针对特定web跟踪器的限制可能会基于用户关于跟踪器的相关联web站点的用户参与度的水平而放宽。例如,如果用户参与度的水平相对较高,则对web跟踪器的限制被放宽。通过这样做,对于对用户相对重要的web站点,与跟踪预防相关联的兼容性风险被缓解。
23.为了在使用期间提高准确性、隐私性并减少计算负载,机器学习模型使用通过爬取大量网站的样本来收集的相同可缩放度量(或信号)被训练。这些样本以相同的方式缩放,使用随着样本大小按比例放大的相同未知量。训练决策使用已知跟踪器的足够大的基
准真相列表来通知应该被分类的跟踪模式。
24.跟踪器的分类以可缩放的方式发生,可以随着用户浏览模式和行为在用户组之间以及随时间两者不同而动态地为用户自定制。分类还以保护隐私的方式进行,以确保在存在查看分类的侧信道攻击时,关于用户的浏览模式的潜在敏感信号受到保护而不被公开。
25.前述技术有利地缩放到各种用户浏览模式,更准确地检测各种较新的未知跟踪器,并通过防止个人或私人信息的逆向工程来保护用户的隐私。未能保护用户的数据遭受将用户的浏览历史记录泄露给恶意实体的风险。为了进一步增强隐私,当用于分类(但不是训练)时,少量随机噪声可能被引入经模糊的度量,以确保不可知的数量不能被逆向工程。
26.此外,根据本文描述的缓解技术,某些跟踪器可能会选择性地从用户经常参与的站点被解除阻止。这可以确保用户定期访问的站点继续按预期工作,即使在它们可能被标识为跟踪器并经受存储限制的情况下。
27.例如,图1示出了根据示例实施例的用于对web跟踪器进行分类并缓解经分类的web跟踪器的影响的系统100的框图。如图1所示,系统100包括web跟踪器分类器102和web跟踪器缓解器104。web跟踪器分类器102被配置为对在由用户使用的浏览器应用访问的各种web站点上执行的web跟踪器进行分类。web跟踪器分类器102被配置为基于与web跟踪器相关联的度量对web跟踪器进行分类。web跟踪器分类器102在每web站点的基础上确定度量并且在每web站点的基础上对web跟踪器进行分类。例如,当浏览器应用访问特定web站点时,web跟踪器分类器102确定与在其上执行的web跟踪器相关联的各种度量。度量包括但不限于针对web站点被加载的一个或多个资源的类型、(多个)资源在其上被加载的频率、浏览器应用被重定向到的一个或多个统一资源定位符(url)、经由web站点发出的应用编程接口(api)调用(例如,网络和/或存储请求)的类型和/或数目等。(多个)资源的示例包括但不限于脚本(例如,javascripts)、级联样式表(css)、图像等。
28.为了保护用户的隐私,web跟踪器分类器102使用浏览简档和/或模式的未知描述符将度量缩放到用户的浏览简档或历史。用于缩放度量的数量随用户浏览模式的变化而变化。除浏览器应用之外的实体(例如,web站点或web跟踪器)不知道缩放的度量。也就是说,缩放的度量不被浏览器应用的用户代理暴露。因此,这样的度量不能被web站点和/或在其上执行的跟踪器或恶意实体(诸如黑客)查询。度量的缩放模糊了来自这些实体的度量。为了进一步增强安全性,web跟踪器分类器102可以将少量噪声(例如,随机噪声)引入经缩放的度量。这有利地确保了不可知的量不能被逆向工程。这样的度量被提供给机器学习模型,该机器学习模型输出在特定web站点上执行的特定web跟踪器的分类106。分类106被提供给web跟踪器缓解器104。关于web跟踪器分类器102的附加细节在下面的小节a中描述。
29.web跟踪器缓解器104被配置为缓解经分类的web跟踪器的影响。例如,web跟踪器缓解器104可以限制由经分类的web跟踪器对由浏览器应用在其上执行的计算设备维护的存储装置的访问。这防止了web跟踪器访问存储在计算设备上的cookie、存储用于跨互联网跟踪用户的每用户标识符等。换言之,这可以防止web跟踪器跟踪用户。
30.web跟踪器缓解器104还被配置为基于某些标准选择性地解除阻止(或放宽)跟踪器活动。例如,如果web跟踪器与用户经常参与的web站点相关联,则web跟踪器缓解器104可以不限制某些web跟踪器的存储访问。例如,web跟踪器缓解器104可以确定关于特定web站点的用户参与度得分。如果用户参与度得分超过预定阈值,则web跟踪器缓解器104不限制
web跟踪器的存储访问。如果用户参与度得分未超过(或低于)预定阈值,则web跟踪器的存储访问继续被限制。
31.根据一个实施例,web跟踪器缓解器104可以不限制针对与特定组织(例如,公司或域)相关联的web跟踪器的存储访问。例如,如果针对与特定组织相关联的特定web站点的用户参与度得分超过预定阈值,则该web跟踪器在与该特定组织相关联的所有web站点上不受限制。前述有利地确保可能引起兼容性问题的存储限制不被应用于用户经常参与(并且因此可能期望在浏览的同时工作)的web站点,并且确保用户免受与他们从未参与的web站点相关联的web跟踪器的影响。关于web跟踪器缓解器104的附加细节在下面的小节b中描述。
32.a.示例性web跟踪器分类器实施例
33.图2示出了根据示例实施例的用于对web跟踪器进行分类的系统200的框图。如图2所示,系统200包括web跟踪器分类器202、浏览器应用220、机器学习模型206和web跟踪器缓解器204。web跟踪器分类器202是web跟踪器分类器102的示例,并且web跟踪器缓解器204是web跟踪器缓解器104的示例,如上面参考图1所描述的。同样如图2所示,浏览器应用220已经访问了web站点224,web跟踪器208经由该web站点224执行。web跟踪器208可以被配置为跟踪收集、存储和/或共享关于互联网上特定用户的活动(例如,浏览器应用220的用户)的信息。web跟踪器208可以分析用户的活动以提供与用户的确定偏好相关的内容(例如,有针对性的广告)。web跟踪器208可以使用各种技术来执行前述。例如,web跟踪器208可以将cookie存储在用户的计算设备的存储装置中。cookie可以用于向用户建议内容、记住用户证书等。在另一示例中,web跟踪器208可以在web站点224中加载资源,这些资源跟踪用户的行为和/或捕获与用户的计算设备和/或在其上执行的应用有关的信息。这样的资源的示例包括但不限于嵌入在web站点224中的像素跟踪器或图像、在用户访问web站点224时执行的脚本、针对web站点224加载的css等。这样的(多个)资源可以利用对用户的计算设备的api请求来获得与用户有关的信息,例如,经由网络和/或存储请求。web站点224还可以利用重定向,将浏览器应用220引导到一个或多个其他web站点,这些web站点读取个性化的引用报头和url参数,从而允许这些web站点观察用户的浏览历史的部分并经由cookie存储这些部分。
34.如图2进一步所示,web跟踪器分类器202包括度量确定器212、模糊器214、噪声生成器218和数据存储装置216。度量确定器212被配置为确定与web跟踪器208相关联的度量。这样的度量包括但是不限于针对web站点224被加载的(多个)资源的类型、(多个)资源针对web站点224被加载的频率、浏览器应用220被重定向到的(多个)url、由web跟踪器208调用的api的类型和/或数目等。度量确定器212将确定的度量存储在数据存储装置216中。数据存储装置216可以是本文描述的和/或如受益于本公开的(多个)相关领域的技术人员将理解的任何类型的物理存储器和/或存储设备(或其一部分)。
35.模糊器214被配置为从数据存储装置216取回度量并模糊度量以保护用户的浏览器历史(例如,浏览器历史210)免受web站点224、web跟踪器208或任何其他恶意实体的影响。模糊器214通过将度量缩放到用户的浏览器历史210来模糊度量。例如,模糊器214可以基于以下来缩放度量:用户在浏览器历史210的预定持续时间内访问的web站点的总数、在浏览器历史210的预定持续时间内经由多个web站点被加载的(多个)资源的总数、在浏览器历史210的预定持续时间内浏览器应用220被重定向到的web站点的总数、通过由用户在浏
览器历史210的预定持续时间内访问的多个web站点发布的api的总数等。预定持续时间的示例包括但不限于用户的过去两周的用户的浏览器历史210、上个月的用户的浏览器历史210、过去六个月的用户的浏览器历史210、用户浏览器历史210的全部等。作为示例,为了模糊度量,模糊器210可以确定在浏览器历史210的预定持续时间内特定的一组度量(例如,针对web站点224被加载的资源的数目)与访问的web站点的总数之间的比率。特别地,模糊器210可以将浏览器210的在预定持续时间内针对web站点224被加载的资源的数目和访问的web站点的总数相除,以生成经缩放的度量。注意,上述模糊技术纯粹是示例性的,并且可以使用浏览器历史210的其他方面来缩放度量,如上所述。根据一个实施例,可以周期性地改变预定持续时间以进一步增强对用户的隐私保护。
36.因此,用于缩放度量的浏览器历史210的数量随用户的浏览模式的变化而变化,并且对于浏览器应用220以外的实体是不可知的。例如,浏览器应用220(例如,浏览器应用220的用户代理),因此不能被其他实体(诸如web站点224、web跟踪器208或恶意实体)查询。
37.模糊器214还可以被配置为将噪声注入到经缩放的度量中。例如,噪声生成器218可以生成噪声,其通过模糊器214与缩放的度量相组合。根据实施例,噪声生成器218包括被配置为随机生成噪声的随机噪声生成器。然而,应当注意,本文描述的实施例不限于此,并且可以利用用于产生噪声的其他技术。
38.由模糊器214向机器学习模型206提供经缩放的(并且可选地,注入噪声的)度量。机器学习模型206被配置为接收作为输入的度量并且针对web跟踪器208生成分类222。为了生成机器学习模型206,互联网上的多个web站点可以被爬取。与多个web站点中的每个被爬取的web站点相关联的度量以与上面参考模糊器214描述的类似方式被缩放。例如,与特定web站点相关联的度量基于以下被缩放:被爬取的web站点的总数、经由爬取的web站点被加载的(多个)资源的总数、浏览器应用220经由被爬取的web站点被重定向到的web站点的总数、由被爬取的web站点发布的api的总数等。对于每个web站点,对应于与该web站点相关联的已知web跟踪器的标签被提供给机器学习算法。标签将与对应于已知web跟踪器的web跟踪器相关联的跟踪模式通知机器学习算法。因此,机器学习算法学习与多个web跟踪器相关联的模式并生成机器学习模型(例如,机器学习模型206),该机器学习模型被配置为针对由用户访问的web站点将web跟踪器分类。下面参考图4和图5描述关于机器学习模型206的附加细节。
39.分类222被提供给web跟踪器缓解器204。web跟踪器缓解器204被配置为缓解经分类的web跟踪器(即,web跟踪器208)的影响。例如,web跟踪器缓解器204可以限制经分类的web跟踪器对由浏览器应用220在其上执行的计算设备维护的存储装置的访问。这防止了web跟踪器208访问存储在计算设备上的cookie、存储用于跨互联网跟踪用户的每用户标识符等。换言之,这防止了web跟踪器208跟踪用户。关于web跟踪器缓解器204的附加细节在下面参考小节b被描述。
40.这样的技术能够在新的网络攻击者出现在新域时对它们进行智能和自动分类。因此,用户可以被保护免受对检测/阻止跟踪器感兴趣的各方以前从未见过或检测到的跟踪器的影响。尽管用户的浏览模式会随时间而变化,并且可能会发生变化,但可以为所有用户提供平等的保护,不会偏向任何特定的细分市场或用户类型。为了智能地做出这些决策,敏感信息(例如,有关用户的浏览历史的方面)被利用。这些技术确保该信息被保护、不可知,
并且可以以安全和私密的方式进行分类。
41.web跟踪器分类器202和web跟踪器缓解器204可以作为浏览器应用220的特征并入,或者可以随后经由浏览器扩展、插件等作为浏览器应用220的一部分并入。机器学习模型206还可以作为浏览器应用220、web跟踪器分类器202和/或web跟踪器分类器204的一部分并入。备选地,机器学习模型206可以在远离浏览器应用220、web跟踪器分类器202和/或web跟踪器缓解器204在其上执行的计算设备的计算设备上执行。例如,机器学习模型206可以在云服务平台的节点(例如服务器)上执行。云服务平台的示例包括但不限于以在云服务平台的节点(例如服务器)上执行。云服务平台的示例包括但不限于云计算平台,由华盛顿雷德蒙德的microsoft corporation拥有。
42.因此,web跟踪器可以以多种方式被分类和缓解。例如,图3示出了根据示例实施例的用于对web跟踪器的影响进行分类和缓解的方法的流程图300。在一个实施例中,流程图300可以由系统200实现,如图2中所述。因此,流程图300将继续参考图2来描述。基于以下关于流程图300和系统200的讨论,其他结构和操作实施例对于(多个)相关领域的技术人员将是明显的。
43.图3的流程图300开始于步骤302。在步骤302中,与由浏览器应用访问的web站点相关联的跟踪器相关的度量被确定。例如,参考图2,web跟踪器分类器202的度量确定器212确定与web跟踪器208相关的度量,该度量与由浏览器应用220访问的web站点224相关联。
44.根据一个或多个实施例,跟踪器相关的度量包括以下至少一项:针对web站点被加载的一个或多个资源的类型、一个或多个资源针对web站点被加载的频率、或浏览器应用被重定向到的一个或多个统一资源定位符。例如,参考图2,存储在数据存储装置216中的跟踪器相关的度量包括以下至少一项:针对web站点224加载的(多个)资源的类型、(多个)资源针对web站点224被加载的频率、浏览器应用220被重定向到的(多个)url等。
45.在步骤304,跟踪器相关的度量至少基于用户的浏览器历史被模糊。例如,参考图2,模糊器214至少基于浏览器历史210来模糊跟踪器相关的度量。
46.根据一个或多个实施例,跟踪器相关的度量基于用户的浏览器历史和随机生成的噪声被模糊。例如,参考图2,模糊器214基于浏览器历史210和由噪声生成器218生成的随机生成的噪声来模糊跟踪器相关的度量。
47.在步骤306,经模糊的度量被提供作为对机器学习模型的输入。机器学习模型被配置为基于经模糊的度量输出与web站点相关联的web跟踪器的分类。例如,参考图2,经模糊的度量作为输入被提供给机器学习模型206。机器学习模型206被配置为输出与web站点224相关联的web跟踪器208的分类222。
48.在步骤308,要针对web跟踪器被执行的缓解至少基于分类被确定。例如,参考图2,web跟踪器缓解器204被配置为至少基于分类222来确定要针对web跟踪器208被执行的缓解。
49.根据一个或多个实施例,缓解包括限制由web跟踪器对浏览器应用在其上执行的计算设备的存储装置的访问。例如,参考图2,web跟踪器缓解器204限制由web跟踪器208对浏览器应用220在其上执行的计算设备的存装置储的访问。存储装置的示例包括但不限于本文描述的和/或如受益于本公开的(多个)相关领域的技术人员将理解的任何类型的物理存储器和/或存储设备(或其一部分)。
50.图4示出了根据示例实施例的用于生成机器学习模型的方法的流程图400。在一个
实施例中,流程图400可以由系统500实现,如图5中所述。图5示出了根据示例实施例的用于生成机器学习模型的系统500的框图。系统500包括模型训练器502、机器学习算法504和机器学习模型506。机器学习模型506是机器学习模型206的示例,如上面参考图2所述。流程图400将参考图5来描述。基于以下关于流程图400和系统500的讨论,其他结构和操作实施例对于(多个)相关领域的技术人员将是明显的。
51.图4的流程图400开始于步骤402。在步骤402中,针对多个第二web站点中的每个第二web站点,将与该第二web站点相关联的跟踪器相关的度量作为训练数据提供给机器学习算法。与第二web站点相关联的跟踪器相关的度量基于多个第二web站点被模糊。例如,参考图5,模型训练器502可以爬取多个web站点508并且获得针对与web站点508相关联的每个web跟踪器的跟踪器相关的度量510。模型训练器502可以基于多个web站点508来模糊所确定的跟踪器相关的度量。
52.例如,与特定web站点相关联的度量可以通过基于以下被缩放:被爬取的web站点508的总数、经由被爬取的web站点508加载的(多个)资源的总数、浏览器应用220经由爬取的web站点508被重定向到的web站点的总数、由爬取的web站点508发布的api的总数等。模型训练器502向机器学习算法504提供经模糊的度量(例如度量510)。
53.在步骤404,来自多个标签的标签被提供给机器学习算法,该标签指定来自多个(已知)web跟踪器的web跟踪器,该web跟踪器对应于与第二web站点相关联的跟踪器相关的度量。机器学习算法基于针对多个第二web站点中的每个web站点的跟踪器相关的度量和多个标签来生成机器学习模型。例如,参考图5,模型训练器502提供标签512,该标签512指定对应于跟踪器相关的度量(即,度量510)的web跟踪器。标签通知机器学习算法504与对应于已知web跟踪器的标签(即,标签512)相关联的跟踪模式。因此,机器学习算法504学习与多个已知web跟踪器相关联的模式并生成机器学习模型506,该机器学习模型506被配置为对用于由用户访问的web站点的web跟踪器(新的和旧的两者)进行分类。
54.b.示例性web跟踪器缓解器实施例
55.虽然一些跟踪器不向用户提供任何价值(诸如跟踪结帐页面上的“像素”,该“像素”跟踪用户在他们的购物车中放入了什么,使得他们以后可以在他们未能结帐时被广告针对),但例如启用单点登录服务(例如,“利用facebook登录”、“利用gmail登录”等)的其他跟踪器为最终用户提供价值/便利以换取用户的数据。
56.本文描述的实施例选择性地对来自用户经常参与的web站点的某些跟踪器解除阻止。这确保了他们定期访问的web站点继续按预期工作,即使在它们可能被标识为跟踪器并受到存储限制的情况下。例如,实现“利用facebook登录”能力的web站点是facebook可能被分类为跟踪器并且其存储访问被限制从而破坏用户的登录能力的情况的示例。这些实施例在下面参考图6和图7被描述。
57.图6示出了根据示例实施例的用于缓解web跟踪器的影响的系统600的框图。如图6所示,系统600包括浏览器应用602、web跟踪器缓解器604和存储设备618。web跟踪器缓解器604是web跟踪器缓解器204的示例,并且浏览器应用602是浏览器应用220的示例,如上面参考图2所描述的。同样如图6所示,浏览器应用602已经访问了web站点606,web跟踪器608经由该web站点606执行。web站点606和web跟踪器608是web站点224和web跟踪器208的示例,如上面参考图2相应地描述的。存储设备618表示由浏览器应用602在其上执行的计算设备
维护的存储装置。存储设备618可以是本文描述的和/或如受益于本公开的(多个)相关领域的技术人员将理解的任何类型的物理存储器和/或存储设备(或其一部分)。如图6进一步所示,web跟踪器缓解器604包括强制执行器620、缓解引擎610、站点参与度引擎612、第一数据存储装置614和第二数据存储装置616。第一数据存储装置i614和第二数据存储装置616中的每个可以是本文描述的和/或如受益于本公开的(多个)相关领域的技术人员将理解的任何类型的物理存储器和/或存储设备(或其一部分)。
58.强制执行器620被配置为接收针对web跟踪器608的分类622。分类622是分类222的示例,如上文参考图2所述。然而,注意web跟踪器缓解器604可以被配置为接收基于与上面在小节a中描述的那些技术不同的web跟踪器分类技术的分类。强制执行器620被配置为执行针对web跟踪器608的缓解。例如,强制执行器620可以限制由web跟踪器608对存储设备618的访问,该存储设备618由浏览器应用602在其上执行的计算设备维护。例如,强制执行器620可以监测由web跟踪器608经由浏览器应用602做出的存储请求(例如,读取和/或写入请求)并阻止这样的请求。这防止了web跟踪器608访问存储在存储设备618中的cookie,防止在存储设备618中存储用于跨互联网跟踪用户的每用户标识符等。在其他一些示例中,强制执行器620可以监测网络请求,例如使浏览器应用602重定向到另一个web站点的请求,并阻止这样的请求。
59.缓解引擎610被配置为基于某些标准放宽由某些web跟踪器做出的存储访问和/或网络请求。根据一个实施例,这样的标准包括针对与web跟踪器相关联的web站点的用户的参与度水平。例如,站点参与度引擎612被配置为针对由用户使用浏览器应用602参与的每个web站点生成用户参与度得分。站点参与度引擎612被配置为随用户参与度的增加而增加针对特定web站点的参与度得分,并且被配置为随用户参与度的降低而降低针对特定web站点的参与度得分。例如,每次用户经由浏览器应用602访问web站点606时,每次用户提供针对web站点606的用户输入(例如,点击、突出显示、滚动等)时,每次用户在web站点上花费预定持续时间时,或者以有意义的其他方式与web站点606交互,站点参与度引擎612可递增用户参与度得分。站点参与度引擎612可以在用户在预定持续时间(例如,5天)之后没有访问web站点606之后递减用户参与度得分。例如,如果用户在预定持续时间之后没有访问web站点606,则用户参与度得分可能随时间呈指数衰减。站点参与度引擎612将针对其生成了得分的每个web站点的用户参与度得分存储在数据存储装置616中。数据存储装置616维护用户参与度得分和针对其生成了得分的web站点之间的映射。例如,数据存储装置616可以包括数据结构(诸如表格),该数据结构将每个web站点与其用户参与度得分相关联。
60.当用户经由浏览器应用602访问web站点606时,强制执行器620查询缓解引擎610以确定要执行的缓解的类型。作为响应,缓解引擎610向数据存储装置616查询与web站点606相关联的用户参与度得分。缓解引擎610将用户参与度得分与预定阈值相比较。如果用户参与度得分超过预定阈值,则缓解引擎610确定用户频繁与web站点606交互并向强制执行器620提供通知,该通知指示对web跟踪器608的限制可以被放宽。例如,响应于接收这样的通知,强制执行器620可以不限制由web跟踪器608做出的存储访问和/或网络请求。如果用户参与度得分没有超过预定阈值,则缓解引擎610确定用户不频繁与web站点608交互并向强制执行器620提供指示对web跟踪器608的限制要被维持的通知。
61.根据一个实施例,web跟踪器缓解器604可以不限制针对与web站点所属的特定组
织(例如,公司或域)相关联的web跟踪器的存储访问。例如,如果针对与特定组织相关联的特定web站点的用户参与度得分超过预定阈值,则与该组织相关联的web跟踪器在与该特定组织相关联的所有web站点上不被限制。
62.例如,数据存储装置614可以存储将针对多个web站点的url关联到它们相应的组织的映射。例如,数据存储装置614可以包括数据结构(诸如表格),该数据结构将特定组织与其相关联的相应url相关联。数据存储装置616还可以将针对特定web站点确定的用户参与度得分关联到与该web站点相关联的组织。当用户访问web站点时,强制执行器620查询缓解引擎610以确定其web跟踪器是否应该被限制或不被限制。强制执行器620可以将web站点的url提供给缓解引擎610。缓解引擎610查询数据存储装置614以确定与该web站点相关联的组织。缓解引擎610查询数据存储装置616以确定与所确定的组织相关联的用户参与度得分。
63.缓解引擎610将用户参与度得分与预定阈值相比较。如果用户参与度得分超过预定阈值,则缓解引擎610确定用户频繁与同组织相关联的web站点交互并向强制执行器620提供指示对web跟踪器608的限制可以被放宽的通知。例如,响应于接收这样的通知,强制执行器620可以不限制由web跟踪器608做出的存储访问和/或网络请求。如果用户参与度得分没有超过预定阈值,则缓解引擎610确定用户不频繁与同组织相关联的web站点交互并向强制执行器620提供指示对web跟踪器的限制要被维持的通知。
64.因此,web跟踪器的影响可以通过多种方式被缓解。例如,图7示出了根据示例实施例的用于缓解web跟踪器的影响的方法的流程图700。在一个实施例中,流程图700可以由系统600实现,如图6中所描述的。具体而言,流程图700可以由web跟踪器缓解器604实现。因此,将继续参考图6来描述流程图700。基于以下关于流程图700和系统600的讨论,其他结构和操作实施例对于(多个)相关领域的技术人员将是明显的。
65.图7的流程图700开始于步骤702。在步骤702中,针对web站点的用户参与度得分被确定。例如,参考图6,站点参与度引擎612确定针对web站点606的用户参与度得分并将该得分存储在数据存储装置616中。
66.根据一个或多个实施例,用户参与度得分至少基于以下一项或多项:由用户使用浏览器应用访问web站点的次数、由用户使用浏览器应用在web站点上花费的时间、用户使用浏览器应用经由web站点提供用户输入的次数、或者自从用户使用浏览器应用访问web站点以来的持续时间。例如,参考图6,由站点参与度引擎612针对web站点606确定的用户参与度得分基于以下一项或多项中的至少一项:web站点606被用户使用浏览器应用602访问的次数、由用户使用浏览器应用602在web站点606上花费的时间、用户使用浏览器应用602经由web站点606提供用户输入的次数、或者自从用户使用浏览器应用602访问web站点606以来的持续时间。
67.在步骤704,用户参与度得分超过预定阈值的确定被做出。例如,参考图6,缓解引擎610向数据存储装置616查询与web站点606相关联的用户参与度得分,将用户参与度得分与预定阈值相比较,并确定用户参与度得分超过预定阈值。作为响应,缓解引擎610向强制执行器620提供指示对web跟踪器608的限制要被放宽的指示。
68.在步骤706,web跟踪器对计算设备的存储装置的访问不被限制。例如,参考图6,强制执行器620不限制web跟踪器608对浏览器应用602在其上执行的计算设备的存储设备618
的访问。
69.根据一个或多个实施例,由浏览器应用访问的第二web站点与第一web站点相同的组织相关联的确定被做出。响应于该确定,对计算设备的存储装置的访问针对第二web站点的web跟踪器不被限制。例如,参考图6,当经由浏览器应用602访问另一个web站点(未示出)时,强制执行器620查询缓解引擎610以确定与该web站点相关联的web跟踪器是要被限制还是不要被限制。强制执行器620可以将web站点的url提供给缓解引擎610。缓解引擎610查询数据存储装置614以确定与该web站点相关联的组织。数据存储装置616可以将针对特定web站点确定的用户参与度得分关联到与该web站点相关联的组织。缓解引擎610查询数据存储装置616以确定与所确定的组织相关联的用户参与度得分。
70.缓解引擎610将用户参与度得分与预定阈值相比较。如果用户参与度得分超过预定阈值,则缓解引擎610确定用户频繁与同组织相关联的web站点交互并向强制执行器620提供指示对web跟踪器608的限制可以被放宽的通知。例如,响应于接收这样的通知,强制执行器620可以不限制由web跟踪器做出的存储访问和/或网络请求。如果用户参与度得分不超过预定阈值,则缓解引擎610确定用户不经常与同组织相关联的web站点交互并向强制执行器620提供指示对web跟踪器的限制要被维持的通知。
71.iii.示例移动和固定设备实施例
72.上述系统和方法,包括参考图1至7的web跟踪器分类和缓解技术、web跟踪器分类器102、web跟踪器缓解器104、web跟踪器分类器202、浏览器应用220、机器学习模型206、web跟踪器缓解器204、度量确定器212、数据存储装置216、模糊器214、噪声生成器218、模型训练器502、机器学习算法504、机器学习模型506、浏览器应用程序602、存储设备618、web跟踪器缓解器604、强制执行器620、缓解引擎610、站点参与度引擎612、数据存储装置614和数据存储装置616和/或其中描述的每个组件、以及流程图300、400和700可以在硬件或与软件和/或固件中的一项或两项组合的硬件中实现。例如,web跟踪器分类器102、web跟踪器缓解器104、web跟踪器分类器202、浏览器应用220、机器学习模型206、web跟踪器缓解器204、度量确定器212、数据存储装置216、模糊器214、噪声生成器218、模型训练器502、机器学习算法504、机器学习模型506、浏览器应用602、存储设备618、web跟踪器缓解器604、强制执行器620、缓解引擎610、站点参与度引擎612、数据存储装置614和数据存储装置616和/或其中描述的每个组件、以及流程图300、400和700可以各自被实现为计算机程序代码/指令,该计算机程序代码/指令被配置为在一个或多个处理器中执行并被存储在计算机可读存储介质中。备选地,web跟踪器分类器102、web跟踪器缓解器104、web跟踪器分类器202、浏览器应用220、机器学习模型206、web跟踪器缓解器204、度量确定器212、数据存储装置216、模糊器214、噪声生成器218、模型训练器502、机器学习算法504、机器学习模型506、浏览器应用602、存储设备618、web跟踪器缓解器604、强制执行器620、缓解引擎610、站点参与度引擎612、数据存储装置614和数据存储装置616和/或其中描述的每个组件、以及流程图300、400和700可以在一个或多个soc(片上系统)中被实现。soc可以包括集成电路芯片,其包括以下一项或多项:处理器(例如,中央处理单元(cpu)、微控制器、微处理器、数字信号处理器(dsp)等)、存储器、一个或多个通信接口、和/或另外的电路,并且可以可选地执行接收的程序代码和/或包括嵌入式固件以执行功能。
73.图8示出了示例性移动设备800的框图,包括各种可选的硬件和软件组件,通常示
出为组件802。web跟踪器分类器102、web跟踪器缓解器104、web跟踪器分类器202、浏览器应用220、机器学习模型206、web跟踪器缓解器204、度量确定器212、数据存储装置216、模糊器214、噪声生成器218、模型训练器502、机器学习算法504、机器学习模型506、浏览器应用602、存储设备618、web跟踪器缓解器604、强制执行器620、缓解引擎610、站点参与度引擎612、数据存储装置614和数据存储装置616和/或其中描述的每个组件中的特征/元素的任何数目和组合、以及流程图300、400和700可以被实现为包括在移动设备实施例中的组件802,以及附加和/或备选特征/元件,如(多个)相关领域的技术人员将知道的。注意,任何组件802都可以与任何其他组件802通信,尽管为了便于说明,并未示出所有连接。移动设备800可以是本文其他地方描述或提及的或以其他方式已知的各种移动设备中的任一种(例如,蜂窝电话、智能手机、手持计算机、个人数字助理(pda)等),并且可以允许通过一个或多个通信网络804(诸如蜂窝或卫星网络或利用局域网或广域网)与一个或多个移动设备进行无线双向通信。
74.所示移动设备800可以包括称为处理器电路810的控制器或处理器,用于执行诸如信号编码、图像处理、数据处理、输入/输出处理、功率控制和/或其他功能的任务。处理器电路810是在一个或多个物理硬件电气电路设备元件和/或集成电路设备(半导体材料芯片或管芯)中实现为中央处理单元(cpu)、微控制器、微处理器、和/或其他物理硬件处理器电路的电气和/或光学电路。处理器电路810可以执行存储在计算机可读介质中的程序代码,诸如一个或多个应用814、操作系统812的程序代码、存储在存储器820中的任何程序代码等。操作系统812可以控制组件802的分配和使用并且支持一个或多个应用程序814(又名应用“app”等)。应用程序814可以包括公共的移动计算应用(例如,电子邮件应用、日历、联系人管理器、网络浏览器、消息收发应用)和任何其他计算应用(例如,文字处理应用、地图应用、媒体播放器应用)。
75.如图所示,移动设备800可以包括存储器820。存储器820可以包括不可移除存储器822和/或可移除存储器824。不可移除存储器822可以包括ram、rom、闪存、硬盘或其他众所周知的存储器存储技术。可移除存储器824可以包括闪存或订户标识模块(sim)卡,这在gsm通信系统中是众所周知的,或者其他众所周知的存储器存储技术,诸如“智能卡”。存储器820可以用于存储用于运行操作系统812和应用814的数据和/或代码。示例数据可包括网页、文本、图像、声音文件、视频数据或被设置为要经由一个或多个有线或无线网络向一个或多个网络服务器或其他设备发送和/或从一个或多个网络服务器或其他设备接收的其他数据。存储器820可以用于存储订户标识符,诸如国际移动订户身份(imsi),以及设备标识符,诸如国际移动设备标识符(imei)。这样的标识符可以被传输到网络服务器以标识用户和设备。
76.多个程序可以存储在存储器820中。这些程序包括操作系统812、一个或多个应用程序814、以及其他程序模块和程序数据。这样的应用程序或程序模块的示例可以包括例如用于实现上述系统和方法的计算机程序逻辑(例如计算机程序代码或指令),包括参考图1至7描述的实施例。
77.移动设备800可以支持一个或多个输入设备830,诸如触摸屏832、麦克风834、相机836、物理键盘838和/或轨迹球840,以及一个或多个输出设备850,诸如扬声器852和显示器854。
78.其他可能的输出设备(未示出)可以包括压电或其他触觉输出设备。一些设备可以服务多于一个的输入/输出功能。例如,触摸屏832和显示器854可以被组合在单个输入/输出设备中。输入设备830可以包括自然用户接口(nui)。
79.(多个)无线调制解调器860可以耦合到(多个)天线(未示出)并且可以支持处理器电路810和外部设备之间的双向通信,如本领域众所周知的。(多个)调制解调器860被概括地示出并且可以包括用于与移动通信网络804和/或其他基于无线电的调制解调器(例如,蓝牙864和/或wi-fi 862)通信的蜂窝调制解调器866。蜂窝调制解调器866可以被配置为根据任何合适的通信标准或技术(诸如gsm、3g、4g、5g等)启用电话呼叫(以及可选地传输数据)。(多个)无线调制解调器860中的至少一个无线调制解调器通常被配置为与一个或多个蜂窝网络(诸如gsm网络)通信,用于在单个蜂窝网络内、蜂窝网络之间或移动设备与公共交换电话网络(pstn)之间进行数据和语音通信。
80.移动设备800还可以包括至少一个输入/输出端口880、电源882、卫星导航系统接收器884(诸如全球定位系统(gps)接收器)、加速度计886和/或物理连接器890,它可以是usb端口、ieee 1394(firewire)端口和/或rs-232端口。所示的组件802不是必需的或包罗万象的,因为任何组件可以不存在并且其他组件可以另外存在,如本领域技术人员将认识到的。
81.此外,图9描绘了计算设备700的示例性实现,其中可以实现实施例,包括web跟踪器分类器102、web跟踪器缓解器104、web跟踪器分类器202、浏览器应用220、机器学习模型206、web跟踪器缓解器204、度量确定器212、数据存储装置216、模糊器214、噪声生成器218、模型训练器502、机器学习算法504、机器学习模型506、浏览器应用602、存储设备618、web跟踪器缓解器604、强制执行器620、缓解引擎610、站点参与度引擎612、数据存储装置614和数据存储装置616,和/或其中描述的每个组件,以及流程图300、400和700。此处提供的计算设备700的描述是为了说明的目的而提供的,并且并非旨在限制。如(多个)相关领域的技术人员所知,实施例可以在其他类型的计算机系统中实现。
82.如图9所示,计算设备900包括一个或多个处理器,称为处理器电路902、系统存储器904和总线906,总线906将包括系统存储器904的各种系统组件耦合到处理器电路902。处理器电路902是一个或多个物理硬件电路设备元件和/或集成电路设备(半导体材料芯片或管芯)中实现为中央处理单元(cpu)、微控制器、微处理器、和/或其他物理硬件处理器电路的电气和/或光学电路。处理器电路902可以执行存储在计算机可读介质中的程序代码,诸如操作系统930的程序代码、应用程序932、其他程序934等。总线906表示几种类型的总线结构中的任何一种或多种,包括存储器总线或存储器控制器、外围总线、加速图形端口以及使用各种总线架构中的任何一种的处理器或本地总线。系统存储器904包括只读存储器(rom)908和随机存取存储器(ram)910。基本输入/输出系统912(bios)被存储在rom 908中。
83.计算设备900还具有以下驱动器中的一个或多个驱动器:用于读取和写入硬盘的硬盘驱动器914、用于读取或写入可移除磁盘918的磁盘驱动器916、以及用于从可移除光盘922(诸如cd rom、dvd rom或其他光学介质)读取或写入的光盘驱动器920。硬盘驱动器914、磁盘驱动器916和光盘驱动器920相应地通过硬盘驱动器接口924、磁盘驱动器接口926和光驱动器接口928连接到总线906。驱动器及其相关联的计算机可读介质为计算机提供计算机可读指令、数据结构、程序模块和其他数据的非易失性存储。尽管描述了硬盘、可移除磁盘
和可移除光盘,但其他类型的基于硬件的计算机可读存储介质也可以被使用来存储数据,诸如闪存卡、数字视频磁盘、ram、rom和其他硬件存储介质。
84.多个程序模块可以被存储在硬盘、磁盘、光盘、rom或ram上。这些程序包括操作系统930、一个或多个应用程序932、其他程序934和程序数据936。应用程序932或其他程序934可以包括例如用于实现上面描述的系统和方法的计算机程序逻辑(例如计算机程序代码或指令),包括上面参考图1至7描述的实施例。
85.用户可以通过输入设备(诸如键盘938和指点设备940)将命令和信息输入到计算设备900中。其他输入设备(未示出)可以包括麦克风、操纵杆、游戏手柄、卫星天线、扫描仪、触摸屏和/或触摸板、接收语音输入的语音识别系统、接收手势输入的手势识别系统等。这些和其他输入设备通常通过耦合到总线906的串行端口接口942连接到处理器电路902,但也可以通过其他接口连接,诸如并行端口、游戏端口或通用串行总线(usb)。
86.显示屏944还经由接口(诸如视频适配器946)连接到总线906。显示屏944可以在计算设备900的外部或并入在计算设备900中。显示屏944可以显示信息以及作为用户接口用于接收用户命令和/或其他信息(例如,通过触摸、手势、虚拟键盘等)。除了显示屏944之外,计算设备900可以包括其他外围输出设备(未示出),诸如扬声器和打印机。
87.计算设备900通过适配器或网络接口950、调制解调器952或用于在网络上建立通信的其他部件连接到网络948(例如,互联网)。可以是内部或外部的调制解调器952可以经由串行端口接口942连接到总线906,如图9所示,或者可以使用包括并行接口的另一接口类型连接到总线906。
88.如本文所使用的,术语“计算机程序介质”、“计算机可读介质”和“计算机可读存储介质”通常用于指代物理硬件介质,诸如与硬盘驱动器914相关联的硬盘、可移除磁盘918、可移除光盘922、其他物理硬件介质,诸如ram、rom、闪存卡、数字视频磁盘、zip磁盘、mem、基于纳米技术的存储设备,以及其他类型的物理/有形硬件存储介质(包括图9的系统存储器904)。这样的计算机可读存储介质与通信介质(不包括通信介质)不同并且不重叠。通信介质通常在调制数据信号(诸如载波)中体现计算机可读指令、数据结构、程序模块或其他数据。术语“调制数据信号”是指其特性中的一个或多个以在对信号中的信息进行编码的方式被设置或改变的信号。作为示例而非限制,通信介质包括无线介质,诸如声学、rf、红外线和其他无线介质,以及有线介质。实施例也针对这样的通信介质。
89.如上所述,计算机程序和模块(包括应用程序932和其他程序934)可以存储在硬盘、磁盘、光盘、rom、ram或其他硬件存储介质上。这样的计算机程序也可以经由网络接口950、串行端口接口952或任何其他接口类型来接收。这样的计算机程序在由应用执行或加载时,使计算设备900能够实现本文所讨论的实施例的特征。因此,这样的计算机程序表示计算设备900的控制器。
90.实施例还针对计算机程序产品,该计算机程序产品包括存储在任何计算机可读介质上的计算机代码或指令。这样的计算机程序产品包括硬盘驱动器、光盘驱动器、存储器设备包、便携式记忆棒、存储器卡和其他类型的物理存储硬件。
91.iv.另外的示例实施例
92.本文描述了一种用于分类和缓解web跟踪器的影响的方法。该方法包括:确定与由浏览器应用访问的web站点相关联的跟踪器相关的度量;至少基于用户的浏览器历史来模
糊跟踪器相关的度量;提供经模糊的度量作为对机器学习模型的输入,该机器学习模型基于经模糊的度量输出与web站点相关联的web跟踪器的分类;以及至少基于分类确定要针对web跟踪器被执行的缓解。
93.在上述方法的一个实施例中,跟踪器相关的度量包括以下至少一项:针对web站点被加载的一个或多个资源的类型;一个或多个资源针对web站点被加载的频率;或者浏览器应用被重定向到的一个或多个统一资源定位符。
94.在上述方法的一个实施例中,模糊跟踪器相关的度量还包括:基于用户的浏览器历史和随机生成的噪声来模糊跟踪器相关的度量。
95.在前述方法的一个实施例中,缓解包括:限制由web跟踪器对浏览器应用在其上执行的计算设备的存储装置的访问。
96.在上述方法的一个实施例中,该方法还包括:确定针对web站点的用户参与度得分;确定用户参与度得分超过预定阈值;以及响应于确定用户参与度得分超过预定阈值,不限制由web跟踪器对计算设备的存储装置的访问。
97.在前述方法的一个实施例中,用户参与度得分至少基于以下一项或多项:由用户使用浏览器应用访问web站点的次数;由用户使用浏览器应用在web站点上花费的时间;用户使用浏览器应用经由web站点提供用户输入的次数;或者自从用户使用浏览器应用访问web站点以来的持续时间。
98.在上述方法的一个实施例中,该方法还包括:确定由浏览器应用访问的第二web站点与第一web站点和相同的组织相关联;以及不限制由第二web站点的web跟踪器对计算设备的存储装置的访问。
99.在前述方法的一个实施例中,机器学习模型通过以下被生成:针对多个第二web站点中的每个第二web站点:将与第二web站点相关联的跟踪器相关的度量作为训练数据提供给机器学习算法,与第二web站点相关联的跟踪器相关的度量基于多个第二web站点被模糊;以及提供来自多个标签的一个标签,该标签指定来自多个web跟踪器的的web跟踪器,该web跟踪器对应于与第二web站点相关联的该跟踪器相关的度量,机器学习算法基于针对多个第二web站点的每个第二web站点的跟踪器相关的度量和多个标签生成机器学习模型。
100.本文还描述了一种系统。该系统包括至少一个处理器电路;以及至少一个存储器,该至少一个存储器存储程序代码,该程序代码被配置为由至少一个处理器电路执行,该程序代码包括:跟踪器分类器,被配置为:确定与由浏览器应用访问的web站点相关联的跟踪器相关的度量,至少基于用户的浏览器历史来模糊跟踪器相关的度量,以及提供经模糊的度量作为对机器学习模型的输入,该机器学习模型基于经模糊的度量输出与web站点相关联的web跟踪器的分类;以及跟踪器缓解器,被配置为至少基于分类确定要针对web跟踪器被执行的缓解。
101.在上述系统的一个实施例中,跟踪器相关的度量包括以下至少一项:针对web站点加载的一个或多个资源的类型;一个或多个资源在其上针对web站点被加载的频率;或者浏览器应用被重定向到的一个或多个统一资源定位符。
102.在上述系统的一个实施例中,跟踪器分类器还被配置为基于用户的浏览器历史和随机生成的噪声来模糊跟踪器相关的度量。
103.在前述系统的一个实施例中,跟踪器缓解器还被配置为通过限制由web跟踪器对
浏览器应用在其上执行的计算设备的存储装置的访问来缓解web跟踪器的影响。
104.在上述系统的一个实施例中,应用层认证信息被包括在请求消息的超文本传送协议(http)连接报头中。
105.在前述系统的一个实施例中,跟踪器缓解器还被配置为:确定针对web站点的用户参与度得分;确定用户参与度得分超过预定阈值;并且响应于确定用户参与度得分超过预定阈值,不限制由web跟踪器对计算设备的存储装置的访问。
106.在前述系统的一个实施例中,用户参与度得分至少基于以下一项或多项:由用户使用浏览器应用访问web站点的次数;由用户使用浏览器应用在web站点上花费的时间;用户使用浏览器应用经由web站点提供用户输入的次数;或者自从用户使用浏览器应用访问web站点以来的持续时间。
107.在上述系统的一个实施例中,该跟踪缓解器还被配置为:确定由浏览器应用访问的第二web站点与同第一web站点相同的组织相关联;以及不限制由第二web站点的web跟踪器对计算设备的存储装置的访问。
108.一种计算机可读存储介质,其上记录有程序指令,该程序指令当由计算设备的至少一个处理器执行时执行用于分类和缓解web跟踪器的影响的方法。该方法包括:确定与由浏览器应用访问的web站点相关联的跟踪器相关的度量;至少基于用户的浏览器历史来模糊跟踪器相关的度量;提供经模糊的度量作为对机器学习模型的输入,该机器学习模型基于经模糊的度量输出与web站点相关联的web跟踪器的分类;以及至少基于分类确定要针对web跟踪器被执行的缓解。
109.在上述计算机可读存储介质的一个实施例中,跟踪器相关的度量包括以下至少一项:针对web站点加载的一个或多个资源的类型;一个或多个资源针对web站点被加载的频率;或者浏览器应用被重定向到的一个或多个统一资源定位符。
110.在上述计算机可读存储介质的一个实施例中,模糊跟踪器相关的度量包括:基于用户的浏览器历史和随机生成的噪声来模糊跟踪器相关的度量。
111.在前述计算机可读存储介质的一个实施例中,缓解包括:限制由web跟踪器对浏览器应用在其上执行的计算设备的存储装置的访问。
112.在前述计算机可读存储介质的一个实施例中,该方法还包括:确定针对web站点的用户参与度得分;确定用户参与度得分超过预定阈值;以及响应于确定用户参与度得分超过预定阈值,不限制由web跟踪器对计算设备的存储装置的访问。
113.v.结论
114.虽然上面已经描述了各种实施例,但是应该理解它们只是作为示例而不是限制的方式呈现的。(多个)相关领域的技术人员将理解,在不脱离如所附权利要求所限定的所描述实施例的精神和范围的情况下,可以在其中进行形式和细节上的各种改变。因此,本实施例的广度和范围不应受任何上述示例性实施例的限制,而应仅根据所附权利要求及其等同物来定义。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1