查询统计提供器的制作方法

文档序号:6477826阅读:206来源:国知局
专利名称:查询统计提供器的制作方法
技术领域
本文档一般地涉及广告发布。
背景技术
可以以各种技术来实现选择用于诸如利用搜索结果和其它信息进行呈现(例如,显示)的广告以及那些广告的排序。在一种示例性技术中,进行最初确定以识别与所应用的搜索词语或者其它查询词语或信息相匹配或近似匹配的所有广告。例如,所述匹配可以在查询中的一个或多个词和广告主所识别的以及与诸如活动的特定广告或广告组相关联的关键词之间进行。 例如,销售钓鱼用具的公司可能具有大型诱饵的信息,并且由此可以将诸如"大号(lunker)"、"鲟鱼"和"北美狗鱼热(muskie fever)"之类的词语识别为关键词,以与他们针对这样的大型诱饵的广告相关联。那些广告接着可被系统所考虑用于在向输入这样词语的用户显示搜索结果时进行显示。除其它可能的技术之外,可以在搜索或查询与广告中的文本或者广告中超链接的目标中的文本之间进行比较,或者对关键词、目标文本和广告文本的组合进行。例如,系统可以有效地从广告中选择词语作为关键词以便对在提交与所述关键词相关联的搜索或其它用户动作时的可能显示选择所述广告。如果还存在"近似"匹配,例如,如果查询包括用于所述广告的关键词词语的错误键入/错误拼写或者已知同义词的词语,也可以对可能显示选择广告。匹配广告的组可被称作候选组。 在一些系统中,当用户在广告上进行点击或者以其它方式选择广告时,向所述用户显示广告主的着陆(landing)网页。在所述广告主的网站,用户可以进行购买、下载文档或文件或者进行一些其它可测量的动作。可以使用很多量度来测量广告活动的性能。例如,通过将在网页上的广告上进行点击的用户数量除以所述广告被递送或呈现以供用户观看(即,闪现(impression))的次数来获得点进率(click-through-rate)。转化率是进行了所期望的动作(例如,访问网站)的独特(unique)访问者的百分比。例如,所期望的动作可以是填写表单、访问预定页面或者完成交易或购买。可以向广告主提供性能量度来改进广告活动。

发明内容
—般地,在一个方面, 一种计算机实现的方法包括接收对搜索查询信息的请求,从搜索查询日志识别搜索查询的集合,所述搜索查询日志包括在预定时间长度内提交给搜索服务的搜索查询,其中所述搜索查询的集合中的每一个与至少预定数量的独特标识符相关联,并且提供所述搜索查询的集合。
所述方法的实施方式可包括以下特征中的一个或多个。每个标识符可以与提交包 含所述搜索查询的搜索请求的客户端设备相关联。所述标识符可包括cookie标识符。识别 所述搜索查询的集合可包括识别与广告相关联的搜索查询。所述方法可包括向广告的赞助 者(sponsor)提供所述搜索查询的集合。所述方法可包括基于每个搜索查询和与所述广告 相关联的关键词之间的相似度等级将所述搜索查询的集合分类为两个或更多类型。所述方 法可包括向广告的赞助者提供所述两个或更多类型的搜索查询。所述方法可包括识别触发 所述广告的显示的搜索查询。所述方法可包括识别与所述广告的点击相关联的搜索查询。 所述方法可包括对所述搜索查询进行规范化。对所述搜索查询进行规范化可包括识别所述 搜索查询中的查询词语并且保持所述查询词语的顺序。 —般地,在另一方面, 一种计算机实现的方法包括接收对搜索查询信息的请求,识 别具有低概率包括有用户的个人信息的一个或多个搜索查询,所述用户提交了所述一个或 多个搜索查询,并且提供所述搜索查询的集合。所述识别包括对在预定时间长度内由搜索 服务的用户提交的搜索查询进行处理,以识别每一个均与至少预定数量的独特标识符相关 联的搜索查询的集合。 所述方法的实施方式可包括以下特征中的一个或多个。每个独特标识符可以与提 交包含所述搜索查询的搜索请求的独特客户端设备相关联。每个独特标识符可包括独特 cookie标识符。识别所述搜索查询可包括识别与广告相关联的搜索查询。所述方法可包括 向广告的赞助者提供所述搜索查询的集合。所述方法可包括基于每个搜索查询和与所述广 告相关联的关键词或关键短语之间的相似度等级将所述搜索查询的集合分类为两个或更 多类型。 —般地,在另一方面,一种计算机实现的方法包括从广告的赞助者接收对搜索查 询信息的请求,向所述赞助者提供与所述广告相匹配的搜索查询,所述搜索查询由搜索服 务的用户提交,并且降低所述搜索查询包括所述用户的个人信息的概率。这包括向所述赞 助者提供在预定时间长度内向所述搜索服务提交的搜索查询,其中向所述赞助者提供的每 个搜索查询与至少预定数量的独特标识符相关联。 所述方法的实施方式可包括以下特征中的一个或多个。每个标识符可以与提交包 含所述搜索查询的搜索请求的客户端设备相关联。所述标识符可包括cookie标识符。
—般地,在另一方面,一种装置包括查询统计引擎,用于自动识别具有低概率包括 有用户的个人数据的搜索查询的集合,所述用户提交了所述搜索查询;以及数据存储设备, 用于存储所述搜索查询的集合。所述查询统计引擎从包括在预定时间长度内提交给搜索服 务的搜索查询的搜索查询日志识别搜索查询的集合,并且所述搜索查询的集合中的每一个 与至少预定数量的独特标识符相关联 所述装置的实施方式包括以下特征中的一个或多个。所述装置可包括搜索服务 器,用于接收包含搜索查询的搜索请求,并且将所述搜索查询存储在所述数据存储设备中。 每个标识符可以与提交包含所述搜索查询的搜索请求的客户端设备相关联。所述标识符可 包括cookie标识符。所述查询统计引擎能够对所述搜索查询进行规范化。所述查询统计 引擎能够通过识别所述搜索查询中的查询词语并且保持所述查询词语的顺序对所述搜索 查询进行规范化。 —般地,在另一方面,一种装置包括用于接收对搜索查询信息的请求的装置,用于
7从搜索查询日志识别搜索查询的集合的装置,所述搜索查询日志包括在预定时间长度内提 交给搜索服务的搜索查询。所述搜索查询集合中的每一个已经被搜索服务的至少预定数量 的独特用户提交。所述装置包括用于提供所述搜索查询的集合的装置。 —般地,在另一方面,一种计算机实现的方法包括基于与广告相关联的至少一个 查询关键词接收对搜索查询信息的请求,从与所述至少一个查询关键词相关联的搜索查询 日志识别搜索查询的集合,所述搜索查询的集合包括在预定时间长度内提交给搜索服务的 搜索查询,其中所述搜索查询集合中的每一个与至少预定数量的独特标识符相关联,并且 将所述搜索查询集合与所述广告和至少一个查询关键词相关联。 所述方法的实施方式可包括以下特征中的一个或多个。来自所述搜索查询日志的 搜索查询和所述至少一个查询关键词之间的关联可包括精确匹配、扩展匹配或宽泛匹配。 来自所述搜索查询日志的搜索查询和所述至少一个查询关键词之间的关联可包括精确匹 配、扩展匹配或宽泛匹配中的至少两个的组合。所述方法可包括基于每个搜索查询和所述 查询关键词之间的相似度等级将所述搜索查询的集合分类为两个或更多类型。所述方法可 包括向广告的赞助者提供所述两个或更多类型的搜索查询。所述标识符可包括cookie标 识符。所述方法可包括将所述广告与广告赞助者相关联,并且向所述广告的赞助者提供所 述搜索查询的集合。 —般地,在另一方面,一种计算机实现的方法包括基于与广告相关联的至少一个 查询关键词接收对搜索查询信息的请求,所述广告与广告赞助者相关联,识别基本排除了 提交所述搜索查询的用户的个人信息的一个或多个搜索查询,其中所述识别包括对在预定 时间长度内由搜索服务的用户提交的搜索查询进行处理,以识别每一个均与至少预定数量 的独特标识符相关联的搜索查询的集合。所述方法包括将所述一个或多个搜索查询与所述 至少一个查询关键词相关联,并且向广告的赞助者提供与所述至少一个查询关键词相关联 的搜索查询的集合。 所述方法的实施方式可包括以下特征中的一个或多个。所述方法可包括基于每个 搜索查询和与所述广告相关联的至少一个查询关键词之间的相似度等级将所述搜索查询 的集合分类为两个或更多类型。所述分类可包括匹配方法,所述匹配方法包括精确匹配、扩 展匹配和宽泛匹配中的至少一个。 —般地,在另一方面,一种计算机实现的方法包括从广告的赞助者接收对广告放 置信息的请求,向所述赞助者提供与所述广告相匹配的搜索查询,所述搜索查询由搜索服 务的用户提交,所述搜索查询在每个搜索查询已经被高于预定流行度阈值的多个独特用户 提交时被提供。所述方法包括降低所述搜索查询包括用户的个人信息的概率,包括向赞助 者提供在预定时间长度内提交给搜索服务的搜索查询,其中提供给所述赞助者的每个搜索 查询与至少预定数量的独特标识符相关联。 所述方法的实施方式可包括以下特征中的一个或多个。所述方法可包括通过精确
匹配、扩展匹配和宽泛匹配中的至少一个将所述搜索查询与所述广告进行匹配。 —般地,在另一方面,一种装置包括数据存储设备,用于接收包含搜索查询的搜索
请求并将所述搜索查询存储在所述数据存储设备中的搜索服务器,以及用于从广告赞助者
接收广告以便进行广告放置的广告服务器。所述装置包括查询统计引擎,用于自动识别来
自所述搜索服务器的具有低概率包括有用户的个人数据的搜索查询的集合,所述用户提交
8了所述搜索查询,其中所述查询统计引擎从包括在预定时间长度内提交给所述搜索服务器 的搜索查询的搜索查询日志识别所述搜索查询的集合,并且所述搜索查询的集合中的每一 个与至少预定最小数量的独特用户标识符相关联。所述装置包括将所述搜索查询的集合与 来自广告赞助者的广告进行匹配的匹配引擎。 所述方法的实施方式可包括以下特征中的一个或多个。所述匹配引擎可包括精确
匹配引擎、扩展匹配引擎和宽泛匹配引擎中的至少一个。每个标识符可以与提交包含所述
搜索查询的搜索请求的客户端设备相关联。所述标识符可包括cookie标识符。所述查询
统计引擎可对所述搜索查询进行规范化。所述查询统计引擎可通过识别所述搜索查询中的
查询词语并且保持所述查询词语的顺序来对所述搜索查询进行规范化。 所述装置和方法的优势可包括以下的一个或多个。广告主能够获得关于与其广告
相关的搜索查询的更多信息并且使用该信息改进其广告活动。所述信息还可用于帮助广告
主评估广告是否到达目标观众。广告主和将广告与用户搜索请求进行匹配的搜索服务都能
够产生更多收益。作为经改进的广告活动的结果,用户能够接收到更为相关的广告。在以
下附图和描述中阐述一个或多个实施例的细节。根据所述描述、附图和权利要求,本发明的
其它特征、目标和优势将变得显而易见。


图1是示例性信息检索系统的图。 图2是示例性图形用户界面的图。 图3是搜索查询统计的示例性报告。 图4是用于向广告主提供隐私安全的搜索查询以及相关联信息的示例性过程的 流程图。 图5是一般计算设备的示意性表示。 图6是一般便携式计算设备的示意性表示。 各附图中相同的附图标记表示相同的元素。
具体实施例方式
图1是示例性信息检索系统100的示意图,所述信息检索系统100用于检索并显 示与用户104提交的搜索查询相相配的信息(例如,web文档)和内容(此后称作广告或 简单地称作ad)。系统100向广告主106(广告赞助者)示出搜索查询信息以提供透明度并 且允许广告主106改进广告活动的性能。在一些示例中,系统100向广告主106提供系统 100所接收的搜索查询的原始查询词语,其中搜索查询包括个人信息(例如,家庭住址或社 会安全号码)的概率非常低(例如,接近于零)。 系统100可以接收例如每周数百万次搜索查询,并且手工找出哪些搜索查询不包 括个人信息可能是费力且耗时的。系统100的特征是其能够自动识别具有包含个人信息的 非常低的概率(例如,接近于零)的搜索查询。该技术基于当不同的人提交搜索查询时,他 们不太可能查询相同的特定个人信息这一认识。例如,数十人不可能提交包含完全相同的 社会安全号码的搜索查询。当收集了一段时间内的搜索查询时,不但多个用户所提交的每 个搜索查询不可能包括个人信息,而且那些搜索查询也不可能被追踪到特定用户。
系统100的另一个特征是其向广告主106示出系统100所接收的全部搜索查询的 小部分,而覆盖大部分与广告主106相关的搜索查询。广告主106关心哪些搜索查询会导 致其广告被点击。大部分被点击的广告是通过均由多个用户104所提交的搜索查询所触发 的。在特定广告上进行点击的用户104可能因为键入了相同的搜索词语而可能已经被示出 了特定广告。例如,对于特定便携式音乐播放器的广告的大部分点击可以来自已经键入了 该特定音乐播放器的名称并由此进行了相同或相似查询的用户。例如,系统100可以向广 告主106示出在一段时间内接收的全部独特搜索查询的不足1%,而覆盖超过50%的触发 在所述广告上的点击的搜索查询。 系统100包括搜索服务器108,其使得用户104能够使用例如关键词搜索来搜索信 息。在一些示例中,用户104可以使用在客户端机器122(例如,个人计算机)上执行的web 浏览器120来通过网络124(例如,因特网)访问搜索服务器108。用户104向搜索服务器 108发送包括搜索查询的搜索请求。所述搜索查询可包括一个或多个搜索词语(例如,关键 词或关键短语)。作为响应,搜索服务器108搜索索引IIO,返回与用户104提交的搜索查 询相匹配的页面的列表,并且根据页面排名分值按顺序提供所述页面的列表。搜索服务器 108还可以使得广告在所返回页面的列表旁边进行显示。所述广告可以由广告服务器126 提供。 系统100包括搜索查询日志122,其存储用户104提交的搜索查询以及与所述搜索 查询相关联的信息。所述信息可包括例如指定所述搜索查询何时提交的时间戳、提交所述 搜索查询的用户的IP地址以及独特cookie标识符。与搜索查询相关的信息还可以指示例 如在被搜索查询触发时哪些广告被显示和/或点击。 术语"搜索请求"是指从用户104向搜索服务器108发送的对信息的请求,而术语 "搜索查询"是指所述搜索请求中所包含的搜索词语和运算符(例如,布尔运算符)。来自 不同用户104的搜索请求可包含相同的搜索查询。如以下所描述的,不同用户104可以与 不同标识符相关联,诸如cookie标识符。因此,如果多个用户104提交了相同的搜索查询, 则搜索查询可以与多个独特标识符相关联。 系统100包括查询统计引擎114,其对来自搜索查询日志112的搜索查询116进行 处理并且向广告主106提供与搜索查询116相关的信息。广告主106可以使用与搜索查询 116相关的信息来改进其广告活动并且确定其广告是否到达目标观众。
在一些实施方式中,查询统计引擎114提供图形用户界面200(见图2)以允许广 告主106选择观看什么统计。例如,广告主106可以请求观看触发特定动作的搜索查询,所 述动作例如使得广告被显示、点击或转换。作为响应,查询统计引擎114识别与特定广告和 动作相关联的搜索查询116。查询统计引擎114可以向广告主106提供搜索查询116的原 始查询词语(例如,用户104提交的实际关键词)。查询统计引擎114具有内置的安全措施 以防止示出具有个人信息的搜索查询116。 用户104所提交的搜索查询116可以包括个人信息。例如, 一些用户104可能在 搜索查询中包括其家庭地址以搜索当地信息。 一些用户104可能在搜索查询116中输入其 社会安全号码以观看其社会安全号码是否在公共文档中列出。用户104可能出于其它原因 在搜索查询中输入个人信息。为了保护用户104的隐私,查询统计引擎114识别不包括个 人信息的搜索查询116,其被称作"隐私安全的"查询134,并且将那些查询存储在隐私安全的查询日志118中。查询统计引擎114向广告主106仅提供隐私安全的搜索查询134。
在一些实施方式中,查询统计引擎114通过识别在预定时间长度内已经被至少预 定数量的独特用户所提交的搜索查询116来识别隐私安全的查询134。例如,如果相同的搜 索查询116在一个月或更长时间内被数十个独特用户104所提交,则所述数十个独特用户 104不可能查询相同的特定个人信息。搜索查询116被至少预定数量的独特用户所提交的 要求可被视为流行度阈值,其中仅有在不同用户中流行的搜索查询116才被认为是隐私安 全的。 所述预定数量可以为例如多于IO,并且所述预定时间长度可以为例如多于一个 月。查询统计引擎114用来识别隐私安全的搜索查询134的标准(例如独特用户的数量和 时间长度)可以根据例如搜索服务器108所提供的搜索服务的类型而有所变换。
在一些实施方式中,查询统计引擎114在识别隐私安全的搜索查询134时可以执 行查询规范化来合并(consolidate)搜索查询116。查询规范化可通过将搜索查询分解为 搜索词语(或标记)并且保持所述搜索词语的顺序来执行。例如,搜索查询中的两个关键 词之间的两个或更多空格可以被减少为一个空格。可以从搜索查询移除特殊运算符、否定 词语以及某些连接符号。 例如,搜索查询"apple juice"(在"apple"和"juice"之间具有两个或更多空 格)和搜索查询"即ple juice"(在"即ple"和"juice"之间具有一个空格)可被确定为 相同的搜索查询。搜索查询"即ple-orange juice"和"即ple and juice"也可被确定为与 "apple juice"相同的搜索查询。因此,如果四个不同用户提交了搜索查询"applejuice"、 "apple juice,,、"apple-orange juice,,禾口 "apple and juice,,,查询统计弓l擎114可以认 为搜索查询"即ple juice"被四个独特用户所提交。这提高了查询(例如,"即ple juice"、 "即ple juice,,、"即ple-orange juice,,或"即ple and juice,,)被标记为隐禾厶安全的查询 而不会侵犯隐私的概率,原因在于额外的空格和某些连接符不会公开任何个人信息。
在一些实施方式中,查询统计引擎114使用代理方法基于与用户104相关联的 cookie来确定搜索查询116是否由独特用户104所提交。当用户104使用web浏览器120 访问搜索服务器108时,搜索服务器108被配置为使得web浏览器120在用户104第一次 访问搜索服务器108时在客户端设备122处存储cookie。每个cookie可包括标识符,但是 可以不包括用户104的个人信息。当用户104向搜索服务器108发送搜索请求时,还向搜 索服务器108提供cookie标识符。存储在不同客户端设备122中的cookie可具有不同的 标识符。 查询统计引擎114通过找出与不同cookie标识符相关联的搜索查询138来识别 由独特用户104提交的经规范化的搜索查询116。多个用户104可以使用相同的客户端设 备122,所以不同用户提交的搜索查询116可能与相同的cookie标识符相关联。这通常不 会影响查询统计引擎114识别隐私安全的搜索查询134的能力,原因在于当查询统计引擎 114被配置为识别与至少n个独特cookie标识符相关联的搜索查询116,并且每个cookie 标识符与一个或多个独特用户104相关联时,隐私安全的搜索查询134继而可以与n个或 更多独特用户104相关联。虽然用户104可以使用多个客户端设备122来访问搜索服务器 108并且与多个cookie标识符相关联,但是用户104使用多个客户端设备122提交包括相 同个人信息的相同搜索查询的可能性很低并且这样的活动的频率很低,从而每个查询的独特用户的数量很可能低于独特用户阈值。 在一些实施方式中,用户104具有关闭cookie的选项。当用户104关闭web浏览 器120中的cookie时,搜索服务器108仍然可以向web浏览器120指定cookie,但是web 浏览器120可以不存储所述cookie。当web浏览器120向搜索服务器108发送搜索请求 时,搜索服务器108将接收所述cookie,其包括所述cookie何时生成的第一时间戳以及所 述cookie何时被web浏览器120发送的第二时间戳。搜索服务器108能够通过例如基于 第一和第二时间戳的比较确定cookie的新鲜程度来确定用户104是否关闭了 cookie。如 果两个时间戳之间的差小于例如10秒钟,则认为cookie是新鲜的并且查询统计引擎114 确定用户104已经关闭了 cookie。 在一些实施方式中,已经在关闭了 cookie的情况下提交了相同搜索查询的用户 104可以被聚集在一起并且被查询统计引擎114认为是一个独特用户。因此,如果用于确定 搜索查询116是否为隐私安全的独特用户阈值是p,则如果至少p-l个独特用户104已经提 交了搜索查询116并且没有关闭cookie,而一个或多个用户104已经提交了搜索查询116 但是关闭了 cookie,搜索查询116被认为是隐私安全的。 查询统计引擎114可以基于搜索词语和与广告相关联的关键词的相似度等级将 隐私安全的搜索查询134分类为不同的类型。例如,搜索查询134可被分类为三个类型精 确匹配类型128、短语匹配类型130和宽泛匹配类型132。精确匹配类型128包括其中搜索 词语与广告关键词完全相同的搜索查询134。短语匹配类型130也被称作扩展匹配类型,其 包括其中广告关键词是搜索词语的一部分(例如,其子字符串)的搜索查询134。宽泛匹配 类型132包括其中搜索词语与广告关键词一般性匹配的搜索查询134,例如,广告关键词的 一部分与搜索词语相匹配,广告关键词出现在搜索查询中但是以不同顺序出现,或者广告 关键词是搜索词语的同义词。 例如,如果广告与关键词"plasma hdtv"相关联,则具有搜索词语"plasma hdtv" 的搜索查询134可被置于精确匹配类型128中。具有搜索词语"che即plasma hdtv"的搜 索查询134可被置于短语匹配类型130中,原因在于广告关键词是搜索词语的一部分。具 有搜索词语"hdtvplasma"或"LCD hdtv"的搜索查询134可被置于宽泛匹配类型132中。
系统100可包括匹配引擎(未示出),其将搜索查询集合与广告进行匹配。所述匹 配引擎可包括例如精确匹配引擎、扩展匹配或短语匹配引擎以及宽泛匹配引擎。
查询统计引擎114和所述匹配引擎可使用例如专用硬件、在通用计算机上执行的 软件模块或者定制硬件和软件的组合来实施。 图2是查询统计引擎114所提供以允许广告主106生成各种类型的报告并确定观 看什么查询统计的图形用户界面(GUI)200的示例的图。GUI 200可包括允许广告主106决 定生成什么类型的报告的部分202。在该示例中,选择了搜索查询性能的报告。GUI 200可 包括允许广告主106确定在所述报告中示出什么信息的部分204。在该示例中,选择了术 语"活云力(campaign)"、"广告关键词(ad keyword)"、"搜索查询(search query)"、"匹配类 型(match type)"、"闪现数(number of impressions)"、"点击数(number of clicks)"禾口 "转换数(number of conversions): GUI 200可包括允许广告主106安排定期生成报告 并且在每次生成报告时向广告主106发送电子邮件通知的部分206。 GUI 200可包括允许 广告主106进行附加选择的附加部分。在广告主106完成其选择之后,他可以在"创建报告(create r印ort)"按钮208上进行点击以生成报告。 图3是可由查询统计引擎114向广告主106提供的搜索查询统计的报告300的示 例。报告300可包括各种栏目,例如活动号302、广告关键词304、搜索查询306、匹配类型 308、闪现数310、点击数312和转换数314。报告300中的栏目可基于广告主在图2的GUI 200中的选择进行修改。 图4是用于向广告主106提供隐私安全的搜索查询以及相关联的信息的示例性过 程400的流程图。过程400从广告主接收对广告的查询统计的请求(402)。所述请求可以 指定动作的某个类型,诸如被显示、点击或转换。例如,广告主可以是图1的广告主106,并 且查询统计引擎114可以被用来从广告主106接收所述请求。过程400访问搜索查询日志 以找出在某个时间段期间提交的触发所述广告的搜索查询(404)。例如,所述搜索查询日志 可以是图1的搜索查询日志112,搜索查询可以是搜索查询116,并且查询统计引擎114可 被用来找出在某个时间段期间提交的触发所述广告的搜索查询。 过程400对所述搜索查询进行规范化(406)。例如,查询统计引擎114可被用来 对所述搜索查询进行规范化。过程400识别与至少预定数量的独特用户相关联的搜索查 询(408)。例如,查询统计引擎114可被用来找出每一个均与至少预定数量的独特用户104 相关联的搜索查询116。查询统计引擎114可以通过识别每一个均与至少预定数量的独特 cookie标识符相关联的搜索查询116来使用代理方法。过程400向广告主提供隐私安全的 查询以及相关联的信息(410)。例如,查询统计引擎114可被用来向广告主106提供隐私安 全的查询134以及相关联的信息。 图5是一般计算设备500的示例的示意性表示,其可被用作例如搜索服务器108、 广告服务器126或查询统计引擎114。计算设备500意在表示各种形式的数字计算机,诸如 膝上计算机、台式机、工作站、个人数字助理、服务器、刀片服务器、主机和其它适当计算机。 这里所示出的组件、其连接和关系以及其功能仅意在是示例性的,而并非意在对本文档中 所描述和/或要求保护的发明的实施方式进行限制。 计算设备500包括处理器502、存储器504、存储设备506、连接到存储器504和高 速扩展端口 510的高速接口 508以及连接到低速总线514和存储设备506的低速接口 512。 每个组件502、504、506、508、510和512使用各种总线进行互连,并且可以安装在共用主板 上,或者以其它适宜方式进行安装。处理器502能够处理用于在计算设备500内执行的指 令以便在诸如耦接到高速接口 508的显示器516的外部输入/输出设备上显示用于GUI的 图形信息,所述指令包括存储在存储器504中或者存储设备506上的指令。在其它实施方 式中,如果需要,可使用多个处理器和/或多个总线,以及多个存储器和存储器类型。而且, 可以连接多个计算设备500,每个设备提供必要操作的一部分(例如,作为服务器组、刀片 服务器组、多处理器系统、端对端网络、网格计算设施或自组端对端网络)。
存储器504存储计算设备500内的信息。在一个实施方式中,存储器504是一个 或多个易失性存储单元。在另一实施方式中,存储器504是一个或多个非易失性存储单元。 存储器504还可以是其它形式的计算机可读介质,诸如磁盘或光盘。 存储设备506能够为计算设备500提供大容量存储。在一个实施方式中,存储设 备506可以是或者可包含计算机可读介质,诸如软盘设备、硬盘设备、光盘设备、磁带设备、 闪存或其它类似固态存储设备、或者设备阵列,包括存储域网络或其它配置中的设备。计算机程序产品可有形地实现在信息载体中。所述计算机程序产品还可包含指令,当被执行时, 所述指令执行诸如以上所描述的一个或多个方法。所述信息载体是计算机或机器可读介 质,诸如存储器504、存储设备506、处理器502上的存储器或传播信号。
高速控制器508管理用于计算设备500的带宽密集操作,而低速控制器512管理 较低带宽密集的操作。这样的功能分配仅是示例性的。在一个实施方式中,高速控制器508 耦接到存储器504、显示器516 (例如,通过图形处理器或加速器),并且耦接到可接受各种 扩展卡(未示出)的高速扩展端口 510。在所述实施方式中,低速控制器512耦接到存储设 备506和低速扩展端口 514。可包括各种通信端口 (例如,USB、 IEEE 1394、蓝牙、以太网、 无线以太网)的低速扩展端口 514可耦接到一个或多个输入/输出设备,诸如键盘、指示设 备、扫描仪,或者例如通过网络适配器耦接到诸如交换机和路由器之类的联网设备。
如图所示,计算设备500可以以多种不同形式来实现。例如,其可以实现为标准服 务器520,或者更多时间被实现在这样的服务器的组中。其还可以被实现为机架式服务器系 统524的一部分。此外,其可以在诸如膝上计算机522的个人计算机中实施。每个这样的 设备(例如,标准服务器、机架服务器系统、个人计算机、膝上计算机)可包含一个或多个计 算设备500,并且整个系统可由多个彼此通信的计算设备500构成。 在一些示例中,客户端设备122可以是例如膝上计算机、台式机、工作站、个人数 字助理、移动电话或其它便携式计算设备。 图6是一般便携式计算设备550的示例的示意性表示,除了其他组件外,其包括处 理器552、存储器564、诸如显示器554的输入/输出设备、通信接口 566和收发器568。设 备550还可提供有诸如微驱动器或其它设备的存储设备以提供附加存储。每个组件550、 552、564、554、566和568使用各种总线进行互连,并且若干组件可安装在共用主板上或者 以其它适宜方式进行安装。 处理器552能够执行计算设备550内的指令,包括存储在存储器564中的指令。所 述处理器可被实现为包括分立且多个的模拟和数字处理器的芯片的芯片组。例如,所述处 理器可提供设备550的其它组件的协同,诸如控制用户接口 、设备550所运行的应用以及设 备550所进行的无线通信。 处理器552可以通过耦接到显示器554的控制接口 558和显示接口 556与用户进 行通信。显示器554可以例如是TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光 二极管)显示器,或者其它适当的显示技术。显示接口 556可包括用于驱动显示器554向 用户呈现图形和其它信息的适当电路。控制接口 558可以从用户接收命令并且对其进行转 换以便向处理器552提交。此外,可提供与处理器552进行通信的外部接口 562,以便使得 设备550能够与其它设备进行近域通信。例如,外部接口 562在一些实施方式中可提供有 线通信,或者在其它实施方式中提供无线通信,并且也可使用多个接口 。
存储器564存储计算设备550内的信息。存储器564可以实施为一个或多个计算 机可读介质或媒体、一个或多个易失性存储器单元或者一个或多个非易失性存储器单元。 也可以提供扩展存储器574并通过扩展接口 572将其连接到设备550,所述扩展接口 572可 包括例如SI匪(单列直插存储器模块)卡接口。这样的扩展存储器574可为设备550提供 额外的存储空间,或者还可以为设备550存储应用或其它信息。特别地,扩展存储器574可 包括指令以执行或补充以上所描述的过程,并且还可包括安全信息。例如,扩展存储器574由此可被提供为设备550的安全模块,并且可利用允许对设备550进行安全使用的指令进 行编程。此外,可经由SIMM卡提供安全应用以及附加信息,诸如以不可破坏的方式在SIMM 卡上设置识别信息。 如以下所讨论的,所述存储器可包括例如闪存和/或NVRAM存储器。在一个实施 方式中,计算机程序产品有形地实现在信息载体中。所述计算机程序产品包含指令,当被执 行时,所述指令执行诸如以上所描述的一个或多个方法。所述信息载体是计算机或机器可 读介质,诸如存储器564、扩展存储器574、处理器552上的存储器或者可例如在收发器568 或外部接口 562上接收的传播信号。 设备550可通过通信接口 566进行无线通信,在必要情况下,所述通信接口 566可 以包括数字信号处理电路。通信接口 566可在各种模式或协议下提供通信,除其它之外, 所述模式或协议诸如GSM语音呼叫、SMS、 EMS或匪S消息发送、CDMA、 TDMA、 PDC、 WCDMA、 CDMA2000或GPRS。例如,这样通信可通过射频收发器568进行。此外,诸如可使用蓝牙、 WiFi或其它这样的收发器(未示出)进行短范围通信。此外,GPS(全球定位系统)接收器 模块570可为设备550提供附加的导航和位置相关的无线数据,其可由设备550上运行的 应用适当使用。 设备550还可以使用音频编解码器560进行可听通信,所述音频编解码器560可 以接收来自用户的话音信息并且将其转换为可用的数字信息。音频编解码器560同样可以 诸如通过扬声器为用户生成可听声音,所述扬声器例如在设备550的听筒中。这样的声音 可包括来自语音电话呼叫的声音,可包括记录的声音(例如,语音消息、音乐文件等),并且 还可包括由设备550上运行的应用生成的声音。 如图所示,计算设备550可以以多种不同形式来实现。例如,其可以实现为蜂窝电 话580。其还可以实现为智能电话582、个人数字助理或其它类似移动设备的一部分。
这里所描述的系统和技术的各种实施方式可以以数字电子电路、集成电路、专门 设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合来实现。这些各种实施 方式可包括一个或多个计算机程序中的实施方式,所述计算机程序可在包括至少一个可编 程处理器的可编程系统上执行和/或解释,所述可编程系统可以为专用或通用目的,其耦 接以从存储系统、至少一个输入设备以及至少一个输出设备接收数据和指令和向其传送数 据和指令。 这些计算机程序(也称作程序、软件、软件应用或代码)包括用于可编程处理器的 机器指令,并且能够以高级程序和/或面向对象编程语言来实施,和/或以汇编/机器语言 来实施。如这里所使用的,术语"机器可读介质"、"计算机可读介质"是指用来向可编程处 理器提供机器指令和/或数据的任意计算机程序产品、装置和/或设备(例如,磁盘、光盘、 存储器、可编程逻辑设备PLD),其包括接收机器指令作为机器可读信号的机器可读介质。术 语"机器可读信号"是指被用来向可编程处理器提供机器指令和/或数据的任意信号。
为了提供与用户的交互,这里所描述的系统和技术可在具有用于向用户显示信息 的显示设备(诸如CRT(阴极射线管)或LCD(液晶显示器)监视器)和用户能够通过其向 计算机提供输入的键盘和指示设备(例如,鼠标、轨迹球、触摸敏感屏幕或类似iDrive的组 件)的计算机上实施。也可以使用其它类型的设备来提供与用户的交互;例如,提供给用户 的反馈可以为任意形式的感官反馈(例如,视觉反馈、听觉反馈或触觉反馈);并且来自用户的输入可以以任意形式接收,包括声音、话音或触觉输入。 这里所描述的系统和技术可在计算系统中实现,所述计算系统包括后端组件(例 如,数据服务器),或者其包括中间件组件(例如,应用服务器),或者其包括前端组件(例 如,具有用户能够通过其与这里所描述的系统和技术的实施方式进行交互的图形用户界面 或web浏览器的客户端计算机),或者这样的后端、中间件或前端组件的任意组合。所述系 统的组件可通过任意形式或介质的数字数据通信(例如,通信网络)进行互连。通信网络 的示例包括局域网(LAN)、广域网(WAN)和因特网。 所述计算系统可包括客户端和服务器。客户端和服务器通常彼此远离并且典型地 通过通信网络进行交互。客户端和服务器的关系源自于在各自计算机上运行并且彼此具有 客户端_服务器关系的计算机程序。 已经对本发明的多个实施例进行了描述。然而将要理解的是,可以进行各种改变 而不会背离本发明的精神和范围。例如可以将隐私安全的查询134归类到与以上所描述不 同的类型中。提供给广告主106的搜索查询统计可以与以上所描述的不同。可以通过例如 服务器计算机的相同机器执行两个或更多的搜索服务器108、广告服务器和查询统计引擎 114。搜索查询可包括以不同语言书写的查询词语。以不同语言书写的搜索查询可被认为 是不同的搜索查询,即使它们具有相同的含义。可以以与以上所描述不同的方式来执行搜 索查询的规范化。 可以使用人工智能或模式匹配方法来扩增用于识别隐私安全的查询的过程。例 如,在查询统计引擎114通过识别在预定时间段内提交的与至少预定数量的独特标识符相 关联的搜索查询116来识别隐私安全的搜索查询134之后,查询统计引擎114可以使用人 工智能或模式匹配方法来检查隐私安全的查询134以发现它们是否包括与某些类型的个 人信息相似的模式。例如,查询统计引擎114可以检查搜索查询134以确定它们是否包括 可能是社会安全号码的类型"xxx-xx-xxxx"的模式,或者与信用卡号或银行帐户号码相似 的模式。查询统计引擎114可以从隐私安全的查询日志118排除包括这样的可疑模式的搜 索查询。 例如,在一些实施方式中,最少预定数量的独特标识符可对应于至少10个、50个 或100个独特用户。也可以使用其它预定的数量。基于例如满足具有满足预定数量的用户 的独特标识符的匹配查询的吞吐量所需的时间,预定时间段可以是一小时、一天、一周或其 它时间段。这里所描述的预定数值由此可基于查询的吞吐量以及广告赞助者或整个广告发 布网络所期望的敏感度等级进行调整。 可以对步骤重新排序、添加或移除来使用以上所示出的各种形式的流程。而且,虽 然已经描述了若干应用和方法,但是应当认识到可以预期多个其它应用。此外,图中所描绘 的逻辑流程并不要求所示的特定顺序或连续顺序来实现期望结果。可以提供其它步骤或者 从所描述的流程中删除步骤,并且可以向所描述的系统添加其它组件或从其中删除组件。 因此,其它实施方式在所附权利要求的范围之内。 在附图和描述中阐述了本发明的一个或多个实施例的细节。根据所述描述、附图 和权利要求,本发明的其它特征、目标和优势将变得显而易见。
权利要求
一种计算机实现的方法,包括接收对搜索查询信息的请求;从搜索查询日志识别搜索查询的集合,所述搜索查询日志包括在预定时间长度内提交给搜索服务的搜索查询,其中所述搜索查询的集合中的每一个与至少预定数量的独特标识符相关联;以及提供所述搜索查询的集合。
2. 如权利要求1所述的方法,其中每个标识符与提交包含所述搜索查询的搜索请求的 客户端设备相关联。
3. 如权利要求1所述的方法,其中所述标识符包括cookie标识符。
4. 如权利要求1所述的方法,其中识别所述搜索查询的集合包括识别与广告相关联的 搜索查询。
5. 如权利要求4所述的方法,进一步包括向所述广告的赞助者提供所述搜索查询的集合。
6. 如权利要求4所述的方法,进一步包括基于所述搜索查询的每一个和与所述广告相 关联的关键词之间的相似度等级将所述搜索查询的集合分类为两个或更多类型。
7. 如权利要求6所述的方法,进一步包括向所述广告的赞助者提供所述两个或更多类 型的搜索查询。
8. 如权利要求4所述的方法,进一步包括识别触发所述广告的显示的搜索查询。
9. 如权利要求4所述的方法,进一步包括识别与所述广告的点击相关联的搜索查询。
10. 如权利要求1所述的方法,进一步包括对所述搜索查询进行规范化。
11. 如权利要求io所述的方法,其中对所述搜索查询进行规范化包括识别所述搜索查询中的查询词语并且保持所述查询词语的顺序。
12. —种计算机实现的方法,包括 接收对搜索查询信息的请求;识别具有低概率包括有用户的个人信息的一个或多个搜索查询,其中所述用户提交了 所述一个或多个搜索查询,所述识别包括对在预定时间长度内由搜索服务的用户提交的搜索查询进行处理,以识别每一个均与 至少预定数量的独特标识符相关联的搜索查询的集合;以及提供所述搜索查询的集合。
13. 如权利要求12所述的方法,其中每个独特标识符与提交包含所述搜索查询的搜索 请求的独特客户端设备相关联。
14. 如权利要求12所述的方法,其中每个独特标识符包括独特cookie标识符。
15. 如权利要求12所述的方法,其中识别所述搜索查询包括识别与广告相关联的搜索 查询。
16. 如权利要求15所述的方法,进一步包括向所述广告的赞助者提供所述搜索查询的隹A 朱n o
17. 如权利要求16所述的方法,进一步包括基于所述搜索查询的每一个和与所述广告 相关联的关键词或关键短语之间的相似度等级将所述搜索查询的集合分类为两个或更多 类型。
18. —种计算机实现的方法,包括 从广告的赞助者接收对搜索查询信息的请求;向所述赞助者提供与所述广告相匹配的搜索查询,所述搜索查询由搜索服务的用户提 交;以及降低所述搜索查询包括所述用户的个人信息的概率,包括向所述赞助者提供在预定时 间长度内向所述搜索服务提交的搜索查询,其中向所述赞助者提供的所述搜索查询的每一 个与至少预定数量的独特标识符相关联。
19. 如权利要求18所述的方法,其中每个标识符与提交包含所述搜索查询的搜索请求 的客户端设备相关联。
20. 如权利要求18所述的方法,其中所述标识符包括cookie标识符。
21. —种装置,包括查询统计引擎,用于自动识别具有低概率包括有用户的个人数据的搜索查询的集合, 其中所述用户提交了所述搜索查询,其中所述查询统计引擎从包括在预定时间长度内提交 给搜索服务的搜索查询的搜索查询日志识别所述搜索查询的集合,并且所述搜索查询的集 合中的每一个与至少预定数量的独特标识符相关联;禾口数据存储设备,用于存储所述搜索查询的集合。
22. 如权利要求21所述的装置,进一步包括搜索服务器,用于接收包含搜索查询的搜 索请求,并且将所述搜索查询存储在所述数据存储设备中。
23. 如权利要求21所述的装置,其中每个标识符与提交包含所述搜索查询的搜索请求 的客户端设备相关联。
24. 如权利要求21所述的装置,其中所述标识符包括cookie标识符。
25. 如权利要求21所述的装置,其中所述查询统计引擎对所述搜索查询进行规范化。
26. 如权利要求25所述的装置,其中所述查询统计引擎通过识别所述搜索查询中的查 询词语并且保持所述查询词语的顺序对所述搜索查询进行规范化。
27. —种装置,包括用于从搜索查询日志识别搜索查询的集合的装置,所述搜索查询日志包括在预定时间 长度内提交给搜索服务的搜索查询,所述搜索查询的集合中的每一个已经被所述搜索服务 的至少预定数量的独特用户提交;禾口用于响应于对搜索查询信息的请求而提供所述搜索查询的集合的用户界面。
28. —种计算机实现的方法,包括基于与广告相关联的至少一个查询关键词接收对搜索查询信息的请求; 从与所述至少一个查询关键词相关联的搜索查询日志识别搜索查询的集合,所述搜索查询的集合包括在预定时间长度内提交给搜索服务的搜索查询,其中所述搜索查询的集合中的每一个与至少预定数量的独特标识符相关联;以及将所述搜索查询的集合与所述广告和所述至少一个查询关键词相关联。
29. 如权利要求28所述的方法,其中来自所述搜索查询日志的搜索查询和所述至少一 个查询关键词之间的关联包括精确匹配。
30. 如权利要求28所述的方法,其中来自所述搜索查询日志的搜索查询和所述至少一 个查询关键词之间的关联包括扩展匹配。
31. 如权利要求28所述的方法,其中来自所述搜索查询日志的搜索查询和所述至少一 个查询关键词之间的关联包括宽泛匹配。
32. 如权利要求28所述的方法,其中来自所述搜索查询日志的搜索查询和所述至少一 个查询关键词之间的关联包括精确匹配、扩展匹配或宽泛匹配中的至少两个的组合。
33. 如权利要求32所述的方法,进一步包括基于所述搜索查询的每一个和所述查询关 键词之间的相似度等级将所述搜索查询的集合分类为两个或更多类型。
34. 如权利要求33所述的方法,进一步包括向所述广告的赞助者提供所述两个或更多 类型的搜索查询。
35. 如权利要求28所述的方法,其中所述标识符包括cookie标识符。
36. 如权利要求28所述的方法,进一步包括将所述广告与广告赞助者相关联,并且向 所述广告的赞助者提供所述搜索查询的集合。
37. —种计算机实现的方法,包括基于与广告相关联的至少一个查询关键词接收对搜索查询信息的请求,所述广告与广 告赞助者相关联;识别基本排除了提交所述搜索查询的用户的个人信息的一个或多个搜索查询,所述识 别包括对在预定时间长度内由搜索服务的用户提交的搜索查询进行处理,以识别每一个均与 至少预定数量的独特标识符相关联的搜索查询的集合;将所述一个或多个搜索查询与所述至少一个查询关键词相关联;以及 向所述广告的赞助者提供与所述至少一个查询关键词相关联的搜索查询的集合。
38. 如权利要求37所述的方法,进一步包括基于所述搜索查询的每一个和与所述广告 相关联的所述至少一个查询关键词之间的相似度等级将所述搜索查询的集合分类为两个 或更多类型。
39. 如权利要求38所述的方法,其中所述分类包括匹配方法,所述匹配方法包括精确 匹配、扩展匹配和宽泛匹配中的至少一个。
40. —种计算机实现的方法,包括 从广告的赞助者接收对广告放置信息的请求;向所述赞助者提供与所述广告相匹配的搜索查询,所述搜索查询由搜索服务的用户提 交,所述搜索查询在每个搜索查询已经被高于预定流行度阈值的多个独特用户提交时被提 供;以及降低所述搜索查询包括所述用户的个人信息的概率,包括向所述赞助者提供在预定时 间长度内提交给所述搜索服务的搜索查询,其中提供给所述赞助者的所述搜索查询的每一 个与至少预定数量的独特标识符相关联。
41. 如权利要求40所述的方法,进一步包括通过精确匹配、扩展匹配和宽泛匹配中的 至少一个将所述搜索查询与所述广告进行匹配。
42. —种装置,包括 数据存储设备;搜索服务器,用于接收包含搜索查询的搜索请求并将所述搜索查询存储在所述数据存 储设备中;广告服务器,用于从广告赞助者接收广告以便进行广告放置;查询统计引擎,用于自动识别来自所述搜索服务器的具有低概率包括有用户的个人数 据的搜索查询的集合,其中所述用户提交了所述搜索查询,其中所述查询统计引擎从包括 在预定时间长度内提交给所述搜索服务器的搜索查询的搜索查询日志识别所述搜索查询 的集合,并且所述搜索查询的集合中的每一个与至少预定最小数量的独特用户标识符相关 联;和匹配引擎,用于将所述搜索查询的集合与来自所述广告赞助者的广告进行匹配。
43. 如权利要求42所述的装置,其中所述匹配引擎包括精确匹配引擎、扩展匹配引擎 和宽泛匹配引擎中的至少一个。
44. 如权利要求42所述的装置,其中每一个标识符与提交包含所述搜索查询的搜索请 求的客户端设备相关联。
45. 如权利要求42所述的装置,其中所述标识符包括cookie标识符。
46. 如权利要求42所述的装置,其中所述查询统计引擎对所述搜索查询进行规范化。
47. 如权利要求46所述的装置,其中所述查询统计引擎通过识别所述搜索查询中的查 询词语并且保持所述查询词语的顺序来对所述搜索查询进行规范化。
全文摘要
一种用于提供搜索查询信息的系统。所述系统接收对搜索查询信息的请求,从搜索查询日志识别搜索查询集合,所述搜索查询日志包括在预定时间长度内提交给搜索服务的搜索查询,并且提供所述搜索查询集合。所述搜索查询集合中的每一个与至少预定数量的独特标识符相关联。所述搜索查询集合中的每一个通过精确匹配、扩展匹配和宽泛匹配而与对搜索查询信息的请求相匹配。
文档编号G06F17/30GK101796515SQ200880024690
公开日2010年8月4日 申请日期2008年5月21日 优先权日2007年5月21日
发明者尼古拉斯·C·福克斯, 张峥, 罗伯托·J·巴亚尔多, 莫尼卡·D·差瓦特, 颜伟鹏 申请人:谷歌公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1