分析查询日志以用于管理类别特定的电子内容的制作方法

文档序号:6656693阅读:213来源:国知局
专利名称:分析查询日志以用于管理类别特定的电子内容的制作方法
技术领域
本发明涉及分析查询日志以用于管理类别特定的电子内容。
背景技术
当用户请求电子内容时,用户可能被引向其并不感兴趣的电子内容。例如,传统的搜索引擎检索一组对应于搜索查询的搜索结果。一些搜索结果可能将用户引向其并不感兴趣的互联网资源,即使该搜索结果匹配该搜索查询。例如,当查询涉及多个不同主题而查询提交者对其中一个或多个主题具有相对小的兴趣或者根本没兴趣时,会产生这个问题,在这种情况下,产生表示这些不同主题的每一个的搜索结果。另一个例子,与用户不感兴趣的主题相关的广告可能呈现给用户。再一个例子,可能向用户提供适合不代表该用户的用户群的电子内容。

发明内容
在一个一般方面,提供类别特定的电子内容包括接收对电子内容的请求。请求具有属性。比较所接收请求的属性和与搜索查询日志中所包括的查询相关的属性。基于所检测的在与该类别相关联的属性和所接收请求的属性之间的关系访问类别指示。
实施例可以包括一个或多个以下特征。例如,可以呈现所访问的内容。
接收对电子内容的请求可以包括接收具有标识提交请求的时间段的属性的对电子内容的请求。比较所接收请求的属性与搜索查询日志中所包括的查询属性可以包括比较标识时间段的属性与标识提交查询的时间段的来自搜索查询日志的查询的属性。访问类别指示可以包括基于所检测的在与该类别相关联的时间段和请求属性所标识的时间段之间的匹配访问类别指示。来自查询日志的查询属性可以标识提交该查询时所在的一天中的小时、星期中的一天、一个月中的一天、一年中的一天,一个月中的一个星期、一年中的一个星期或一年中的一个月。所接收请求的属性可以标识提交所接收请求所在的一天中的一个小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的一个星期、一年中的一个星期或一年中的一个月。
接收对电子内容的请求可以包括接收具有标识提交请求的用户的特性的属性的对电子内容的请求。比较所接收请求的属性与搜索查询日志中所包括的查询属性可以包括比较标识用户特性的属性与来自搜索查询日志的标识提交查询的用户的特性的查询属性。访问类别指示可以包括基于所检测到的在与类别相关联的用户特性和由请求属性所标识的用户特性之间的匹配访问类别指示。来自查询日志的查询属性可以标识提交查询的用户的性别、提交查询的用户的年龄、或提交查询的用户的位置。所接收请求的属性可以标识提交所接收请求的用户的性别、提交所接收请求的用户的年龄、或提交所接收请求的用户的位置。
接收对电子内容的请求可以包括接收对包括广告的电子内容的请求。访问电子内容可以包括访问对应于所标识类别的广告。
接收对电子内容的请求可以包括接收将为其检索搜索结果的搜索查询。访问所请求电子内容可以包括访问表示为所接收搜索查询所标识的类别的搜索结果。访问搜索结果可以包括将搜索查询路由到至少一个表示所标识类别的搜索结果的源,并从该至少一个源接收对搜索查询的搜索结果。
访问搜索结果可以包括格式化查询以表示所标识类别,并为所格式化的查询检索搜索结果。格式化查询可以包括为查询增补表示所标识类别的附加信息。增补查询可以包括将查询格式化成所标识类别的查询的规范格式,或者向查询增补一个或多个表示所标识类别的关键字。
访问搜索结果还可以包括标识所接收搜索查询所对应的两个类别。这两个类别可以与所指示的类别相比较,并且可以标识这两个类别其中一个匹配所指示类别的类别。
访问类别指示可以包括访问很可能表示来自日志的属性与所接收请求的属性匹配的查询的类别的指示。
对于每个属性,可以标识来自查询日志的具有该属性的查询。对于每个所标识的查询,可以标识对应于所标识查询的类别。对于对应于所标识查询中一个的每个类别,可以标识该类别对应于所标识查询中一个的概率。访问类别指示可以包括访问具有高概率的类别的指示。
标识对应于所标识查询的类别可以包括对于每个类别,访问对应于该类别的查询列表。当所标识查询的至少一部分匹配在某类别的查询列表中所包括的一个查询的至少一部分时,可以标识该类别对应于所标识的查询。
访问类别指示可以包括访问搜索查询日志,其中每个搜索查询具有属性。可以标识来自日志的属性与所接收请求的属性匹配的查询,并且可以标识对应于所标识查询的类别。
访问类别指示还可以包括访问具有条目的表格。每个条目可以与属性和表示来自搜索查询日志的与该属性相关的搜索查询的类别相关联。可以标识表格的与所接收请求的属性相关联的条目,并且可以标识与表格中所标识条目相关联的类别。访问表格可以包括访问具有条目的表格,其中每个条目与多个属性和表示来自搜索查询日志的与该多个属性相关的搜索查询的类别相关联。标识表格的条目可以包括标识表格的与所接收请求的多个属性相关联的条目。访问表格可以包括访问具有条目的表格,其中每个条目与时间段和表示来自搜索查询日志的在该时间段期间提交的搜索查询的类别相关联。标识表格的条目可以包括标识表格的与接收请求的时间段相关联的条目。
请求可以具有多个属性,其中搜索查询日志中所包括的每个查询可以具有多个属性,并且查询日志中所包括的每个查询可以由多个类别表示。接收对电子内容的请求可以包括接收对电子内容的请求,其中该请求具有多个属性。比较所接收请求的属性和与搜索查询日志中所包括的至少一个查询相关的属性可以包括比较所接收请求的多个属性和与搜索查询日志中所包括的查询相关的多个属性。访问类别指示可以包括基于所检测的与多个类别相关联的属性和所接收请求的属性之间的关系访问多个类别的指示。
在另一个方面,缓存电子内容包括接收电子内容以便包含在缓冲存储器中,其中电子内容具有属性。标识电子内容所对应的类别。比较电子内容的属性和与搜索查询日志中所包括的查询相关的属性。基于所检测与该类别相关联的属性和该电子内容属性之间的关系访问类别的指示。比较所标识类别与所指示类别,并且当所标识类别匹配所指示类别时,将电子内容包含在缓冲存储器中。
接收电子内容可以包括接收具有标识可以缓存电子内容的时间段的属性的电子内容。比较电子内容的属性和搜索查询日志中所包括的查询的属性可以包括比较标识时间段的属性和来自搜索查询日志的标识提交该查询的时间段的查询的属性。访问类别指示可以包括类别的基于所检测的与该类别相关联的时间段和电子内容属性的时间段之间的关系的指示。来自查询日志的查询的属性包括可以标识提交查询所在的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的一个星期、一年中的一个星期或一年中的一个月。电子内容的属性标识可以缓存电子内容的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的一个星期、一年中的一个星期或一年中的一个月。
接收电子内容可以包括接收具有标识提交请求的用户的特性的属性的电子内容。比较电子内容的属性和搜索查询日志中所包括的查询的属性可以包括比较标识用户特性的属性和来自搜索查询日志的标识提交查询的用户的特性的查询的属性。访问类别指示可以包括基于所检测的与该类别相关联的用户特性和电子内容的属性所标识的用户特性之间的关系访问类别的指示。来自查询日志的查询的属性可以标识提交查询的用户的性别、提交查询的用户的年龄、或提交查询的用户的位置。电子内容的属性可以标识可以为其缓存电子内容的用户的性别、可以为其缓存电子内容的用户的年龄、或可以为其缓存电子内容的用户的位置。
电子内容可以包括为表示所标识的电子内容类别的搜索查询所检索的搜索结果。
可以标识来自查询日志的属性与电子内容的属性匹配的查询。对于每个所标识的查询,可以标识所标识查询所对应的类别。对于每个对应于所标识查询中一个的类别,可以标识该类别对应于所标识查询中一个的概率。访问类别指示可以包括访问具有高概率的类别的指示。
标识对应于所标识查询的类别可以包括对于每个类别,访问对应于该类别的查询列表。当所标识查询的至少一部分匹配在对应于某类别的查询列表中所包括的一个查询的至少一部分时,可以标识该类别对应于所标识查询。
电子内容可以具有多个属性,其中搜索查询日志中所包括的每个查询可以具有多个属性,电子内容可以由多个类别表示,并且查询日志中所包括的每个查询可以由多个类别表示。接收电子内容可以包括接收具有多个属性的电子内容。标识电子内容所对应的类别可以包括标识电子内容所对应的多个类别。比较电子内容的属性和搜索查询日志中所包括的查询属性可以包括比较电子内容的多个属性和搜索查询日志中所包括的查询的多个属性。访问类别指示可以包括基于所检测的与该类别相关联的多个属性和电子内容的多个属性之间的关系访问类别的指示。
在另一个方面,一种存储在计算机可读介质或传播信号上的计算机程序当被执行时在显示设备上生成图形用户界面。该图形用户界面包括第一电子内容的满足具有第一属性的请求而呈现的第一显示。满足具有第二属性的请求呈现第二电子内容的第二显示。第一电子内容包括表示代表与第一属性相关的典型查询的来自查询日志的查询的类别的广告,第二电子内容包括表示代表与第二属性相关的典型查询的来自查询日志的查询的类别的电子内容。
实施可以包括以下一个或多个特征。例如,第一属性可以匹配第二属性,或者第一属性可以不同于第二属性。
本发明的这些一般和具体方面可以使用系统、方法或计算机程序,或系统、方法和计算机程序的任何组合来实现。
其他特征可以从说明书、附图和权利要求中变得显而易见。


图1A和1B是显示示例性联网计算环境的框图。
图2A和2B是显示将查询和查询类别相关的示例性本体的框图。
图3A和3B是显示图2A和2B的本体中所包括的示例性类别的框图。
图4是显示用于从查询日志中标识典型的搜索查询类别的示例性过程的流程图。
图5A-5E是标识具有不同属性的搜索查询的类别的表格的框图。
图6是显示用于提供类别特定的电子内容的示例性过程的流程图。
图7是显示用于提供类别特定的广告的示例性过程的流程图。
图8A和8B显示用于呈现包括类别特定的广告的电子内容的示例性界面。
图9是显示用于解析(resolve)模糊对应于多个查询类别的查询的示例性过程的流程图。
图10显示在查询已经被解析为对应于单个查询类别之后为该查询检索搜索结果的示例性界面。
图11是显示格式化查询来表示查询类别的示例性过程的流程图。
图12显示了对于已经被格式化为表示查询类别的查询检索搜索结果的另一个示例性界面。
图13是显示对应于查询类别提交查询到信息源的示例性过程的流程图。
图14是显示为对应于查询类别被提交到一个或多个信息源的查询检索搜索结果的另一个示例性界面。
图15是显示用于管理类别特定电子内容的缓冲存储器的示例性过程的流程图。
在各个图中相似的附图标记表示相似的元件。
具体实施例方式
基于表示多个类别的查询的日志来管理电子内容。处理查询日志以为多个时间段中每一个和/或为可以提供来自查询日志的查询(例如,查询串)的用户的每个人群标识表示在该时间段中由表示该人群的用户提交的来自查询日志的典型查询的一个或多个查询类别。可以在提供电子内容时使用处理后的查询日志。例如,在一个时间段中被提供给特定人群的用户的内容、诸如广告可以对应于一个或多个表示在该时间段期间由该特定人群的用户提交的典型查询的一个或多个类别。搜索查询可以被解析以指向一个或多个类别,被增补描述该一个或多个类别的信息,或者被路由到对应于该一个或多个类别的信息源。此外,电子内容的缓存可以基于查询的日志。例如,电子内容可以在该内容对应于该一个或多个类别时被缓存。
参考图1A,示例性联网计算环境100使用户能够访问电子内容。例如,在特定时间段期间,联网计算环境100使表示特定群体的用户能够访问表示由该特定群体的用户在该特定时间段中所提交的来自查询日志的查询的类别的电子内容。客户系统105由用户操纵以提供搜索查询到搜索引擎110,其中搜索引擎110执行对匹配该搜索查询的特定互联网资源的搜索。搜索引擎110包括用于对查询进行分类的本体115、和查询日志120,其中查询日志120包括指示已经被提交给搜索引擎110的查询的数据。用户还可以从内容服务器125和广告服务器130请求电子内容。网络135互连客户系统105、搜索引擎110、内容服务器125,和广告服务器130。
客户系统105包括一个或多个通信程序,其可以被用户用来提交对特定互联网资源的搜索查询到搜索接口110。通信程序可以包括网页浏览器、e-mail程序、即时消息发送程序、文件传输协议(FTP)程序,或其他通信程序。客户系统105还可以包括一个或多个输入设备,诸如键盘、鼠标、指示笔、照相机,或麦克风,用户可以用其来指定搜索查询。客户系统105还包括一个或多个输出设备,诸如监视器、触摸屏、扬声器,或打印机,电子内容可以通过其呈现给用户。客户系统105还可以被配置来与联网计算环境100的其他组件通信。
搜索引擎110接收由客户系统、诸如客户系统105的用户所指定的查询。搜索引擎110标识匹配已经从用户所接收的查询的互联网资源。搜索引擎110可以使用一个或多个包括互联网资源索引的数据库来标识匹配的互联网资源。索引可以包括与所接收查询匹配的互联网资源的关键字或说明。如果互联网资源的关键字或说明匹配搜索查询,则互联网资源被标识为对所接收查询的搜索结果。搜索引擎110可以被配置来将所接收查询与数据库中索引的所有可能的因特网资源、或者与来自特定源的数据库中索引的互联网资源进行匹配。
本体115,也被称为查询本体,将搜索查询与搜索查询的类别相关。本体115可以将非常多的搜索查询分类成相对少的搜索查询类别。本体115还可以为搜索查询类别中每一个标识一个或多个关键字。类别的关键字可以表示在对应于该类别的查询的搜索结果中以高百分比出现的单词或短语。在一些实施例中,本体115可以为搜索查询类别中每一个标识一个或多个专家域,其表示从其中标识对应于每个特定类别的查询的搜索结果的高百分比的域。本体115的结构将在以下参考图2A,2B,3A和3B更详细地描述。
搜索引擎110将从客户系统105的用户所接收的查询或指示其的数据存储在查询日志120中。在一个实施例中,查询日志120包括查询,提交查询的时间,和描述提交查询的用户的群体信息。描述用户的群体信息可以包括用户的一个或多个属性,诸如用户的性别、用户年龄、和用户位置的指示,诸如用户家庭地址的邮政编码。与查询相关联的群体信息标识提交查询的用户的类型。
搜索引擎110可以使用本体115处理查询日志120,以标识查询日志120中所包括的每个查询的查询类别。基于所标识的查询类别以及查询日志120中所包括的时间和群体信息,搜索引擎110可以标识很可能代表来自查询日志120的在特定时间段期间由特定类型用户提交的查询的一个或多个类别。搜索引擎110处理查询日志120的方式将在以下参考图4更详细地介绍。
内容服务器125和广告服务器130提供电子内容给客户系统105以便响应于来自用户的请求而呈现给客户系统105的用户。例如,内容服务器125可以向客户系统105提供网页、电子消息、诸如e-mail消息和即时消息、音频数据、视频数据、电子文件,或其他电子内容。类似地,广告服务器130可以提供将被包括在内容服务器125所提供的电子内容内的或者将被单独呈现的电子广告。在一个实施例中,请求可以包括一个或多个标识该请求被提交给一个服务器125或130的时间的属性以及描述提交该请求的客户系统105的用户的群体信息。服务器125和130所提供的内容可以是类别特定的,并且服务器125和130可以访问很可能代表来自查询日志120的在从其接收请求的用户类型接收请求的时间段期间提交的查询的一个或多个类别的指示。在一个实施例中,服务器125和130提供表示被访问类别的电子内容。
网络135可以是连接联网计算环境100的组件的网络,诸如互联网、万维网、广域网(WAN)、局域网(LAN)、模拟或数字有线和无线电话网络(例如,公共交换电话网络(PSTN)、综合业务数字网络(ISDN)或数字客户线路(xDSL)、无线电、电视、电缆、卫星,和/或其他任何携带数据的传递机制。联网计算环境100的组件通过支持通过网络135的通信的通信路径连接到网络135。每条通信路径可以包括例如有线、无线、电缆或卫星通信路径,诸如连接到电话线的调制解调器或直接互联网连接。联网计算系统100的组件可以使用串行线路联网协议(SLIP)、点到点协议(PPP),或传输控制协议/联网协议(TCP/IP)以便在网络135上通过通信路径互相通信。
可以使用例如能够以定义的方式响应并执行指令的通用计算机、个人计算机、特定用途计算机、工作站、服务器、设备、组件,或能够响应并执行指令的其他装置或其某种组合来实现联网计算环境100的每个组件。这些组件可以从例如软件应用程序、程序、一段代码、设备、计算机、计算机系统或其组合接收指令,其独立地或集中地指导操作,如这里所述。指令可以永久地或暂时地被实现在任何类型的机器、组件、装置、存储介质或能够被传递到组件的传播信号中。
此外,联网计算环境100的每个组件包括用于通过网络135发送通信的通信接口。通信可以包括例如e-mail消息、即时消息、音频数据、视频数据、通用二进制数据,或文本数据(例如,以美国信息交换标准码(ASCII)编码)。
参考图1B,另一个使用户能够搜索特定互联网资源的示例性联网计算环境150类似于图1A的联网计算环境100。客户系统155由用户操纵以提供查询到搜索接口160,通过该搜索接口160执行对特定互联网资源的搜索。搜索接口160提交查询到一个或多个搜索引擎165a-165n。本体170和查询日志175被用来在提交到一个或多个搜索引擎165a-165n之前澄清和重组查询。网络180互连客户系统155、搜索接口160、和搜索引擎165a-165n。
客户系统155类似于图1A的客户系统105。本体170类似于图1A的本体115,查询日志175类似于图1A的查询日志120。搜索引擎165a-165n中每一个类似于图1A的搜索引擎110。但是,搜索引擎165a-165n与搜索引擎110的不同之处在于,搜索引擎165a-165n不维护本地查询日志。网络180类似于图1A的网络135。
搜索接口160接收来自客户系统155的由用户所指定的查询。搜索接口160可以修改查询并且可以提交查询到搜索引擎165a-165n中的特定搜索引擎,以便检索所接收的查询的代表用户期望的搜索结果的搜索结果。例如,搜索接口160可以标识典型代表在从其接收查询的一类用户接收查询的时间所提交的查询的查询类别。查询可以被澄清,使得查询仅对应于所标识的类别。此外,可以用一个或多个通常在所标识类别的查询的搜索结果中找到的关键字来重组查询。此外,搜索接口160可以将所接收的查询只提交到搜索引擎165a-165n中通常返回所标识类别的查询的搜索结果的特定搜索引擎。基于所标识的查询类别修改所接收的查询并将所接收的查询只提交到搜索引擎165a-165n中特定搜索引擎就使得为所接收查询所检索的搜索结果表示所标识的类别。
搜索接口160还可以以与图1A的搜索引擎110维护查询日志120相似的方式来维护和处理查询日志175。在一个实施例中,搜索引擎165a-165n可以为搜索接口160提供搜索引擎165a-165n所接收的搜索查询的指示,以包括在查询日志175中。在另一实施例中,在将搜索查询转发到搜索引擎165a-165n之前,搜索接口160可以将搜索查询存储在查询日志175中。在搜索接口160处维护和处理查询日志175就防止搜索引擎165a-165n自身这样做。换句话说,在搜索接口160处维护和处理查询日志175就减小了在搜索引擎165a-165n每一个中所需的功能。
此外,在搜索接口165或另一主机位置、诸如搜索引擎165a-165n中一个处维护查询日志175就防止客户系统155必须本地维护和处理查询日志175,从而减小了客户系统155中所需的功能性。但是,在一些实施例中,查询日志175和本体170可以位于客户系统155中,客户系统155可以被配置以维护和处理查询日志175。在这样的实施例中,查询日志175可以包括客户系统155的用户所提交的查询。
中央查询日志175包括比由搜索引擎165a-165n中一个或客户系统155所维护的单独查询日志中存储的更多量的查询。因此,中央查询日志175可以被更好配备或被通知以标识很可能代表在特定时间段期间由特定类型用户所提交的查询的一个或多个类别。
参考图2A和2B,图1A的本体115的一个实施例的一部分包括类别205a-205z,其作为节点被设置在有向非循环图中。类别205a-205z中每一个与代表该类别的一个或多个查询相关联。与类别205a-205z的一个相关联的查询可以被称为被包括在该类别中。类别205a-205z中每一个也可以与该类别的一个或多个关键字和一个或多个专家域相关联。关键字表示与该类别相关联的查询的搜索结果的以高百分比出现的词或短语,专家域表示从其中标识对应于该类别的查询的高百分比搜索结果的域。
当在本体115中第一类别出现在第二类别之上时,该第一类别可以被称为第二类别的父类别,该第二类别可以被称为该第一类别的子类别。例如,在相关术语中,科学类别205d是父类别,类别205g-205k是科学类别205d的子类别。通常,从第一类别直接到第二类别的箭头表示第一类别是第二类别的父类别。更一般地,从第一类别经由一个或多个中间类别到第二类别的一个或多个箭头表示第一类别是第二类别的祖先类别,第二类别是第一类别的子类别。
父类别包括的查询比包括在该父类别的子类别中的查询更上位。例如,科学类别205d比子类别205g-205k更上位,其中子类别205g-205k包括科学的构成或子集,诸如物理类别205g、化学类别205h、动物类别205i、天文类别205j、和生物类别205k。与特定类别相关联的查询可以被称为对应于该特定类别,以及对应于包括在本体115中的作为该特定类别的祖先或子类别的其他类别。此外,作为包括特定查询的类别的祖先或子类别的类别可以被称为对应于该特定类别。在图2A和2B中所示的本体115的实施例中,类别205a-205z中每一个只具有一个父类别。但是,在本体115的其他实施例中,类别205a-205z中每一个可以具有任意数量的父类别和任意数量的子类别。
在一些实施例中,类别205a-205z中一些并不与关键字或专家域相关联。在这样的实施例中,那些类别的关键字和专家域可以是与那些类别的一个或多个祖先或子类别相关联的关键字和专家域。例如,如果没有关键字和专家域与爬行动物类别205q相关联,则来自动物域205i、科学类别205d,或根类别205a的关键字和专家域可以用于爬行动物类别205q。当关键字和专家域与子类别相关联并与子类别的祖先类别相关联时,可以使用来自祖先类别的关键字和专家域来代替该子类别的关键字和专家域或者作为其补充。
在本体115的其他实施例中,类别205a-205z不被安排为定向非循环图中的节点,从而在类别205a-205z之间不存在关系。因此,查询的关键字和专家域仅可以从与该查询相关联的类别中被标识。在这样的实施例中,关键字和专家域可以与所有类别205a-205z相关联。
图3A和3B显示了来自本体115的示例性类别205m和205y。鸟类别205m是动物类别205i、科学类别205d和根类别205a的子类别。足球队类别205y是足球类别205t、运动类别205e和根类别205a的子类别。类别205m和205y分别包括名称305a和305b和相关联的查询列表310a和310b。在该实例中,类别205m被命名为“Birds”,其与包括“eagle”、“robin”、“cardinal”和“blue jay”的查询相关联,类别205y被命名为“足球队”,并且与包括“Washington Redskins”、“Baltimore Ravens”和“Rhiladelphia Eagles”相关联。在查询列表310a和310b中所列出的查询可以手动地或通过标识查询的合适类别的自动过程而与类别205m和205y相关联。
类别205m和205y可以分别与关键字列表315a和315b相关联。关键字列表315a中所包括的关键字代表查询列表310a中所包括的查询的搜索结果中以高百分比出现的单词或短语。类似地,关键字列表315b中所包括的关键字代表频繁出现在查询列表310b中所包括的查询的搜索结果中的单词。在该实例中,关键字列表310a包括关键字“bird”、“nest”、“egg”、“beak”和“talon”,关键字列表310b包括关键字“football”、“game”、“coach”、“quarterback”和“receiver”。
类别205m和205y还可以与专家域列表320a和320b相关联。在专家域列表320a中所包括的专家域代表从其中检索查询列表310a中所包含的查询的高百分比搜索结果的域。类似地,在专家域列表320b中所包含的专家域表示从其中检索查询列表310b中所包含的查询的高百分比搜索结果的域。在该例中,专家域列表320a包括域“www.hbw.com”,“birdingonthe.net”,“home.planet.nl”,“www.mangoverde.com”,“www.camacdonald.com”,“www.birdforum.net”,“www.bird-stamps.org”,“www.phthiraptera.com”,“www.scricciolo.com”和“www.birdlife.net”,专家域列表320b包括域“www.nfl.com”,“www.football.com”。
查询列表315a和315b包括含有单词“eagle”的查询。因此,当从图1A的客户系统105中接收包括单词“eagle”的查询时,或者从查询日志120访问包括单词“eagle”的查询时,类别205m和类别205y都将被标识为对应于所接收的查询。因为“eagle”匹配来自查询列表310a的查询“eagle”和来自查询列表310b的查询“Philadelphia Eagles”,所以可能进行这样的标识。换句话说,查询可以模糊地对应于类别205m和205y二者,即使从其接收查询的用户可能只关注查询205m和205y其中一个。
参考图4,过程400被应用于指示被提交给一个或多个搜索引擎的查询的查询日志。通常,处理查询日志以标识一个或多个典型地代表来自查询日志的在多个时间段中每一个期间由多种类型的用户中每一个所提交的查询的查询类别。过程400可以由查询被提交给的搜索引擎、诸如图1的搜索引擎110来执行。替换地或附加地,过程400可以由电子内容的提供者、诸如图1A的内容服务器125或广告服务器130来执行。在一个实施例中,过程400被周期地执行,并且当随后请求内容时,访问执行过程400的结果。在另一实施例中,每一次接收对电子内容的请求时,执行过程400。在这样的实施例中,可以只处理查询日志的相关部分(例如,在请求电子内容的时间段期间所提交的查询)。为了便于讨论,过程400将被描述为由搜索引擎执行以处理整个查询日志。
更具体地,搜索引擎访问指示代表多个查询类别的查询的日志,诸如图1A的查询日志120(405)。对于多个查询中的每一个,被访问的日志可以包括提交查询的时间指示和提交查询的用户或用户类型的属性指示。搜索引擎从日志中选择查询(410),并且标识所选择查询所对应的一个或多个类别(415)。例如,搜索引擎可以使用本体、诸如图1A的本体115来标识类别。更具体地,搜索引擎将所选择的查询与和在本体中所包括的类别相关联的查询相匹配。如果特定类别对应于匹配所选择查询的至少一部分的查询,则该特定类别对应于所选择查询。
搜索引擎确定被访问日志中是否还有更多的类别还未被分类(420)。如果有,则搜索引擎从日志中选择不同的查询(410),并标识一个或多个该不同的查询所对应的一个或多个查询类别(415)。以这种方式,顺序地对被访问日志中所包括的查询进行分类。
在所有查询已经被分类之后,搜索引擎选择提交来自查询日志中的查询的多个时间段中的一个和提交来自查询日志的查询的用户的多个属性或类型中的一个(425)。例如,这多个时间段可以包括一天中的小时,搜索引擎可以选择该天中的小时(例如,从12:00 P.M.到1:00P.M)或者一年中特定的日子或星期(例如,节日)。这多个时间段还可以包括一个星期、一个月或一年中的某些天、一个月或一年中的一些星期、一年中的一些月,或一天中的不同时间段(例如,早上、下午、晚上和夜里)。用户的多个类型可以取决于用户的年龄、性别和位置。例如,一种类型的用户可以包括New York City中的十多岁的男孩,而另一类型的用户可以包括California的年龄在20到30岁之间的女性。
搜索引擎从日志中标识第一组在所选择时间段期间由所选择属性或类型的用户所提交的查询(430)。例如,搜索引擎可以顺序地从日志访问每个查询,并确定该查询被提交的时间的指示是否落在所选择时间段中,以及提交该查询的用户或用户类型的属性的指示是否匹配所选择的属性。如果是,责该查询被添加到该第一组。
搜索引擎还选择对应于来自第一组的查询中一个的类别(435)。搜索引擎从第一组中标识对应于所选择类别(440)的第二组查询(440)。为此,搜索引擎可以从第一组顺序地访问每个查询,并确定之前所确定的查询类别是否匹配所选择类别。如果是,则该查询被添加到第二组。因为只有来自第一组的查询可以被包括在第二组中,所以第二组是第一组的子集。
搜索引擎确定来自第一组的查询被包括在第二组中的可能性(445)。在一个实施例中,确定可能性包括如果查询被包括在第一组中,则确定该查询被包括在第二组中的概率。这种概率可以例如通过将第二组中所包括的查询数量除以第一组中查询的数量来计算。搜索引擎还可以使用其他计算来确定概率。
搜索引擎确定是否要为更多查询类别计算对应于来自第一组的查询的概率(450)。如果是,则搜索引擎选择不同的查询类别(435),从第一组中标识对应于该不同类别的第二组查询(440),并确定来自第一组的查询被包括在第二组中的可能性(445)。以这种方式,可以顺序地为来自第一组的查询所对应的每个类别确定概率。当已经为每个类别确定对应于来自第一组的查询的可能性之后,搜索引擎为所选择的时间段和所选择的用户属性/类型(下文中称为“类型”)标识一个或多个具有高可能性的类别(445)。换句话说,搜索引擎可以标识相关概率超过阈值的类别。所标识的类别代表对应于来自日志的在所选择时间段期间由所选择类型的用户所提交的典型查询的类别。更通常地,所标识的类别可以代表在所选择时间段中通常被请求、被检索、被提供或者被呈现给所选择类型的用户的电子内容的类别。
搜索引擎确定是否要为更多时间段和用户类型确定这种类别(460)。如果是,则搜索引擎选择不同的时间段和不同的用户类型(425),并标识一个或多个对应于来自日志的在该不同时间段由该不同用户类型的用户所提交的查询的具有高可能性的类别(430-455)。以这种方式,为来自日志的查询被提交的每个时间段和提交来自日志的查询的用户类型中每一个标识一个或多个类别。
搜索引擎然后使为该多个时间段中的每一个和为该多个用户类型中的每一个所标识的类别的指示为可访问的,以用于管理如何请求、搜索、提供或呈现电子内容(455)。在一个实施例中,查询日志中所包括的查询可以在被添加到查询日志中时被分类。每个查询可以被存储在查询日志中,并具有该查询所对应的一个或多个类别的指示。在这样的实施例中,查询不需要在在过程400中被分类。换句话说,查询不需要被从日志中选择出并顺序地被分类(405-420)。相反,当标识查询是否对应于所选择类别时,可以访问所存储的对应于查询的类别的指示(440)。该指示可以包括所标识类别的之前所确定的可能性。搜索引擎可以本地地将所标识类别的指示存储在电子内容提供者可访问的位置。替换地或附加地,搜索引擎可以发送所标识类别的指示到电子内容提供者。
在一个实施例中,所标识类别的指示可以被组织成表格,诸如图5A-5E中所示的那些,或者被组织成可以由基于查询日志管理电子内容的系统访问的相应的逻辑数据结构。表格可以将多个时间段和多个类型的用户与为该多个时间段和该多个类型的用户所标识的类别的指示相关。
特别地,参考图5A-5E,表格500、520、540、560和580存储代表在多个时间段中每一个期间和/或由多个类型用户中每一个所提交的典型查询的一个或多个类别的指示。表格500、520、540、560和580可以被产生并可以由内容提供者通过执行图4的过程400来访问。表格500、520、540、560和580中每一栏对应于与搜索查询或搜索查询类别相关的属性。表格500、520、540、560和580中每一行存储代表与由该行所标识的特定属性相关的典型查询的一个或多个类别的指示。
例如,表格500标识代表在多个时间段-诸如一天中的小时-中每一个期间所提交的搜索查询的类别。表格500指示在9A.M.和10A.M.之间所提交的典型地对应于类别“W”的搜索查询。
类似地,表格520标识代表在一星期的每一天所提交的搜索查询的类别。例如,表格520指示类别“D”典型地代表在星期二所提交的查询。
表格540标识代表在每一类型的日子(例如,工作日、周末、假日)期间所提交的搜索查询的类别。所示的表格540标识代表在特定假日所提交的搜索查询的类别。例如,表格540指示类别“E”典型地代表在复活节所提交的查询。
表格560标识代表在一天中多个部分(例如,上午、下午、晚上和夜晚)所提交的搜索查询的多个类别。例如,表格580指示在下午,搜索查询典型地由类别“A”、“H”和“G”代表。由一行所指示的类别可以被分类,使得在标有“类别1”的栏中出现的类别比在标有“类别2”的栏中出现的类别更可能代表在特定时间段期间所提交的查询。
表格580表示代表具有多个属性的特定值的查询的类别。多个属性可以标识提交搜索查询的时间段和提交该查询的用户的特性。例如,表格580指示“news”类别典型地代表在晚上由成年男性所提交的查询。
参考图6,过程600被用来标识和提供代表在请求电子内容的用户中在请求电子内容的时刻受欢迎的电子内容的类别的电子内容,其中基于对在一个时间段期间由一种类型的用户所提交的代表该类别的搜索查询的分析来指示在该时间段期间该类型的用户的类别的受欢迎程度。过程600由电子内容提供者执行,诸如图1A的搜索引擎110、内容服务器125,或广告服务器130。
电子内容提供者接收对电子内容的请求(605)。电子内容可以包括网页、广告、e-mail消息、即时消息、文件,或其他电子内容。替换地或附加地,电子内容可以包括搜索结果,在该情况下,查询可以是为其检索搜索结果的搜索查询。可以从其上将显示被请求电子内容的客户系统、诸如图1的客户系统105接收请求。替换地,可以从使用来自该电子内容提供者的内容的另一电子内容提供者接收请求。
电子内容提供者确定提交请求的时间(610)。请求可以包括时间指示作为请求属性,在该情况下,可以从请求中标识时间。替换地或附加地,时间可以是电子内容提供者接收请求的时间。电子内容提供者访问一组建立的时间段,诸如一天中的小时或者一星期中的某些天(615)。电子内容提供者基于所确定的请求提交时间来确定哪个时间段与请求相关。
类似地,电子内容提供者确定提交请求的用户的一个或多个属性(625)。请求可以包括用户属性的指示作为请求属性,在该情况下,可以从请求标识用户属性。用户也可以具有与电子内容提供者的帐户,其指示用户的属性。因此,电子内容提供者可以访问帐户以标识属性。电子内容提供者访问一组建立的用户类型,诸如一个或多个用户群体(630)。电子内容提供者基于所确定的用户属性确定哪个用户类型与请求相关(635)。
电子内容提供者访问反映或支持确定之前所接收的在所确定的时间段期间由所确定的用户类型所提交的搜索查询的一个或多个类别的表格(640)。被访问的表格可以通过之前执行图4的过程400而产生。例如,电子内容提供者可以访问图5A-5E的表格500、520、540、560或580中的一个。基于被访问的表格,电子内容提供者标识至少一个代表在所确定的时间段期间由所确定的类型的用户所提交的典型搜索查询的类别(645)。例如,电子内容提供者可以在表格中标识对应于所确定的时间段和所确定的用户类型的条目。由所标识的表格条目所指示的类别是代表在所确定的时间段期间由所确定的类别的用户所提交的典型搜索查询的类别。
在图6的过程600的替换实施例中,不访问(640)和使用(645)通过之前执行图4的过程400所产生的表格,电子内容提供者而是可以执行过程400。在这样的实施例中,并不是使新执行过程400的结果作为表格而可访问,电子内容提供者而是可以直接使用该结果。在一些替换实施例中,电子内容提供者可以仅仅执行过程400中与所确定的时间段和所确定的用户类型相关的部分。
电子内容提供者访问代表所标识类别的电子内容(650)。例如,被访问的电子内容可以包括与所标识类别相关的广告。更具体地,如果所标识的类别与电子产品相关,则电子内容提供者可以访问可以从其购买电子产品的零售商或者描述电子产品的信息源的广告。访问内容可以包括从类别特定电子内容的本地商店访问内容,或者从代表所标识类别的电子内容源检索电子内容。被访问的电子可以被提供给请求电子内容用于呈现的客户系统(655)。
参考图7,过程700被用于标识和提供代表从搜索查询中看起来在请求电子内容的用户中在对应于请求电子内容的时刻受欢迎的电子内容的类别的广告。过程700表示图6的过程600的一个实施例。过程700由广告提供者、诸如图1A的广告服务器130执行。
广告服务器接收对广告的请求(705)。在一个实施例中,广告可以是独立的广告,诸如弹出式广告或下推式广告。在另一实施例中,广告可以被包括在其他电子内容中。例如,广告可以是网页内的条状广告或漂浮广告。在这样的实施例中,对广告的请求可以是对电子内容的请求。广告可以作为图形用户界面的一部分被显示,其中在界面首次被显示时或在稍后产生请求。
广告服务器可以从将在其上显示所请求的电子内容的客户系统、诸如图1A的客户系统105接收请求。请求可以手动地由客户系统的用户产生,或者自动地由在客户系统上运行的应用程序或程序产生。在其中广告将被包括在另一段电子内容中的实施例中,对广告的请求可以从该电子内容的提供者接收。例如,用户可以提交对包括用于一个或多个广告的空间的网页的请求。在这样的情况下,请求可以是从用户所接收的原始请求或者可以是来自网页提供者的对包括在该网页中的一个或多个广告的请求。
广告服务器可以标识接收请求的时间段(710)和从其接收请求的用户的类型(715)。广告服务器访问反映或支持确定之前接收的在所标识的时间段期间由所标识的用户类型的用户所提交的搜索查询的一个或多个类别的表格(720)。基于被访问的表格,广告服务器标识代表在所标识时间段期间由所标识类型的用户所提交的典型搜索查询的类别(725)。广告服务器访问代表所标识类别的广告(730)。广告服务器提供所请求的电子内容,包括所访问的广告(735)。这样的操作以与图6的过程600的相应操作相类似的方式被执行。
参考图8A和8B,界面800可以用来显示电子内容805给用户。电子内容805包括广告810。在图8A和8B中,电子内容805作为网页被显示。在其他实施例中,电子内容可以是电子消息的替换形式,诸如e-mail消息或即时消息,或是已经添加广告810的其他一段电子内容。
图8A和8B显示单个界面800如何能够被定制以在不同时间生成不同显示,例如因为用户在不同时间导航到该网页。例如,图8A的界面800在12:36 P.M.被显示,而图8B的界面800在7:59 P.M.被显示。为了示例的目的,假设这些不同的时间对应于不同的时间段,其中对于不同的时间段标识不同类别的查询为代表在相应时间段期间所提交的查询,例如基于根据图4的过程400处理查询日志。更具体而言,假设查询日志指示在12:00 P.M.和1:00 P.M.之间所提交的查询通常与电子产品相关,在7:00 P.M.和8:00 P.M.之间所提交的查询通常与名人新闻有关。因此,当电子内容805被提供以在12:36 P.M.呈现时,广告810被选择以便呈现,如图8A的界面800所示。此外,当电子内容805被提供以在7:59 P.M.呈现时,则名人新闻和八卦内容被选择用于呈现,如图8B的界面800所示。
在一些实施例中,除了指示响应于查询而提供的电子内容的类别之外,查询日志还可以指示要被提供的电子内容的类型或其他有关查询的信息。例如,查询日志可以被处理以标识电子内容的类型,其代表在特定时间段期间和/或由特定类型的用户所提交的查询的搜索结果。当在特定时间段期间提供电子内容到特定类型的用户时,可以访问所标识类型的内容的指示,并且代表所标识类型的内容可以被提供给用户。例如,处理查询日志可以指示为从12 P.M.到1 P.M.所提交的查询所提供的搜索结果典型地来自与新闻相关的网页,而在7 P.M.到8 P.M.所提交的查询所提供的搜索结果典型地是在线游戏。因此,从12 P.M.到1 P.M.所请求的电子内容可以被从与新闻相关的网站提供,而在线游戏可以响应于从7 P.M.到8 P.M.的请求而被提供。
参考图9,过程900被用于解析在一个时间段期间从特定类型的用户接收的查询,以指向(refer to)单个查询类别。查询被解析到的类别可以是通常对应于在该时间段期间由该特定类型的用户所提交的查询的类别。过程900表示图6的过程600的一个实施例。过程900由搜索引擎执行,诸如图1A的搜索引擎110或者图1B的搜索引擎165a-165n中的一个,或者由搜索接口执行,诸如图1B的搜索接口160。为了便于讨论,过程900将被描述为由搜索引擎执行。
搜索引擎在对应于多个时间段中一个的时间从对应于多个类型的用户中一个的用户接收搜索查询(905)。搜索查询可以从可以访问搜索引擎的客户系统、诸如图1A的客户系统105接收。搜索引擎标识所接收的查询所对应的搜索查询的多个类别(910)。搜索引擎可以使用本体来标识该多个类别,诸如图1A的本体115或者图1B的本体170。在一个实施例中,搜索引擎将所接收的查询与和本体所包括的类别相关联的查询相匹配。如果特定类别对应于至少匹配所接收查询的一部分的查询,则该特定类别和本体中其他与该特定类别相关的类别对应于所接收的查询。
搜索引擎可以标识接收搜索的时间段(915)和标识接收搜索查询的用户的类型(920)。搜索引擎访问反映或支持确定之前所接收的在所标识的时间段期间由所标识的用户类型的用户所提交的搜索查询的一个或多个类别的表格(925)。基于所访问的表格,搜索引擎标识该多个类别中代表在所标识时间段期间由所标识类型的用户所提交的典型搜索查询的一个(930)。例如,搜索引擎可以使用所访问的表格来标识代表在所标识时间段期间由所标识类型的用户所提交的典型搜索查询的类别。搜索引擎然后可以确定该多个类别中哪一个匹配从所访问表格中所标识的类别。
搜索引擎检索代表为所接收搜索查询所标识的类别的搜索结果(935)。为此,搜索引擎可以向查询增补与所标识类别相关联或标识所标识类别的信息。向查询增补信息就使查询只对应于所标识的类别。换句话说,增补查询就将查询解析为所标识类型。所接收的查询可以被增补,使得所增补的查询不是可察觉的。搜索引擎可以为所增补的查询检索搜索结果,或者可以提供所增补的查询到一个或多个搜索引擎,使得该一个或多个搜索引擎可以为该增补的查询检索搜索结果。在提交查询到搜索引擎之前,所增补的查询可以被重组,以粘附到搜索引擎接受查询的语法中。
向查询增补与所标识类别相关联或标识所标识类别的信息可以包括将查询格式化为所标识类别的所接收查询的规范格式。所标识类别的被输入查询的规范格式是与所标识类别相关联的查询,其匹配输入的查询。当查询并不完全匹配与所标识类别相关联的查询时,则查询的规范格式不同于该查询。例如,查询“eagles”匹配与足球类别相关联的查询“Rhiladelphia Eagles”。因此,“Rhiladelphia Eagles”可以是足球类别的查询“eagles”的规范格式。
替换地或附加地,可以为查询增补一个或多个与所标识类别相关联的关键字。关键字代表在与所标识类别相关联的查询的搜索结果中以高百分比发现的单词或短语。关键字可以与所标识的类别相关联或者与和本体中所标识的类别相关的类别相关联。可以为查询增补关键字,使得为增补的查询所检索的搜索结果包括这些关键字中至少一个。
搜索引擎提供所检索的搜索结果以呈现给提供搜索查询的用户(940)。例如,搜索结果可以被提供给从其中最初接收搜索查询的客户系统。客户系统可以将搜索结果呈现给在客户系统上指定搜索查询的用户。
参考图10,当被访问时,搜索工具用户界面1000可以通过图1B的搜索接口160被呈现给图1B的客户系统155的用户。例如,搜索工具用户界面1000可以是响应于来自客户系统155的请求通过搜索接口160发送给客户系统155的网页。客户系统155可以通过在客户系统155上运行的网页浏览器将搜索工具用户界面1000呈现给用户。搜索工具用户界面包括文本区域1005和按钮1010。用户可以输入搜索查询到搜索区域1005。如图所示,用户在文本区域1005中已经输入了“eagles”作为搜索查询。在搜索查询已经被输入到文本区域1005之后选择按钮1010就提交搜索查询到搜索接口160,使得可以标识搜索查询的搜索结果。
搜索工具界面1000在已经选择提交按钮1010之后显示已经为在文本区域1005中所输入的搜索查询所检索的搜索结果1015a-1015e。界面1000包括原始搜索查询的指示符1020。界面1000还包括原始查询被解析到的查询类别的指示符1025和原始查询所对应的但是原始查询没有被解析到的其他类别的指示符1030。
指示符1025和1030指示搜索查询对应于本体115中的多个类别。例如,查询中一个对应于本体170中音乐类别的查询匹配搜索查询,如指示符1025所指示。此外,指示符1030指示对应于本体170中足球类别的查询匹配搜索查询,并且对应于本体170中鸟类别的查询匹配搜索查询。
指示符1025和1030还可以指示在文本区域1005中所输入的查询的用于对应类别的规范格式。输入查询的对于特定类别的规范格式是与匹配输入的查询的特定类别相关联的查询。例如,输入的查询匹配与音乐类别相关联的查询“The Eagles”,那么“The Eagles”是输入的查询的用于音乐类别的规范格式。类似地,“Rhiladelphia Eagles”是输入的查询的用于足球类别的规范格式,“eagles”是输入的查询的用于鸟类别的规范格式。
查询可以被解析以指向单个查询类别,其典型代表在查询的同时所接收的查询。当查询被解析以指向由指示符1025所指示的类别时,为在文本区域1005中所输入的查询增补与该类别相关联的信息。例如,查询可以被重新格式化为该类别的查询的规范格式。更具体而言,查询被解析以只指向音乐类别,使得查询被重新格式化为“TheEagles”,其是该查询的用于音乐类别的规范格式。此外,可以为查询增补一个或多个与本体115中音乐类别相关联的关键字。这样的重新格式化和增补可以在文本区域1005中被指示。
作为通过为查询增补与音乐类别相关联的信息来澄清查询的结果,搜索结果1015a-1015e都表示音乐类别。更具体而言,搜索结果1015a-1015e表示匹配增补的查询的互联网资源,其只表示查询本体115中的音乐类别。因此,搜索结果1015a-1015e都与名字为“TheEagles”的音乐相关。
在一些实施例中,查询可以被澄清以指向用户并不希望的类别。在这样的实施例中,指示符1025和1030中的一个可以被选择来检索表示对应于所选择指示符的类别的搜索结果。例如,指示符1030的两个部分可以是可选择的,其中第一部分对应于足球类别,第二部分对应于鸟类别。用户可以选择指示符1030的第一或第二部分以解析查询到和检索表示对应于所选择部分的类别的搜索结果。在指示符1030的一部分已经被选择之后,用户可以选择指示符1025以检索表示最初查询被解析到的音乐类别的搜索结果。
当选择指示符1025和1030中的一个时,由指示符1020所标识的原始查询可以为查询增补与对应于所选择的类别的类别相关联或标识与所选择指示符所对应的类别的信息。可以为增补的查询检索搜索结果,并且搜索结果可以被呈现在界面1000上。此外,指示符1025和1030可以被修改以指示原始查询已经被解析到的新的类别。修改后的指示符1025和1030可以被选择以检索表示不同类别的搜索结果,如上所述。
此外,用户可以手动地指示查询不被解析为特定类别,以便检索不必表示该特定类别的搜索结果。例如,用户可以选择指示符1020以指示要检索不必表示特定类别的搜索结果。
参考图11,过程1100被用来将在一段时间期间从特定类型的用户所接收的查询格式化为表示典型地对应于在该段时间期间由该特定类型的用户所提交的查询的类别。过程1100表示图6的过程600的一个实施例。过程1100由搜索引擎执行,诸如图1A的搜索引擎110,或图1B的搜索引擎165a-165n,或者由搜索接口执行,诸如图1B的搜索接口160。为了便于讨论,过程1100将被描述为由搜索引擎来执行。
对于所接收的搜索查询,搜索引擎标识表示在由从其接收该搜索查询的用户类型的用户接收该搜索查询的时间段期间所提交的典型搜索查询的类别(1105)。这样的操作可以以与图6的过程600类似方式执行。
搜索引擎将所接收的搜索查询格式化以表示所标识的类别(1110)。查询可以被格式化成用于所标识的查询的规范格式,或者可以被增补以与所标识的查询相关联的关键字,如图9的过程900所实现的那样。搜索引擎为被格式化后的搜索查询检索搜索结果(1115)并提供所检索的搜索结果以呈现给提供搜索查询的用户(1120)。
参考图12,搜索工具用户界面1000显示在为查询增补一个或多个与特定查询类型相关联的关键字之后为文本区域1005中所输入的查询所检索的搜索结果1205a-1205e。该特定类型可以是典型地表示在由对应于用户界面1000的用户的用户类型在文本区域1005中输入查询的时间段期间所接收的查询的类别。如果输入到图10的文本区域1005的搜索查询只对应于一个类别,则图12所示的搜索工具用户界面1000可以在选择了图10中所示的搜索工具用户界面1000的按钮1010之后被呈现。替换地,在查询已经被解析以只指向多个类别中一个之后,图12所示的搜索工具用户界面1000可以被呈现。这两种方法中任何一种都可以被用来显示一个类别或用于增补搜索查询的多个类别。此外,在用户编辑文本区域1005以添加或省略类别方面,自动分类器(例如图9)过程可以被自动脱离或者用户界面可以被提供以便手动地脱离这样的过程。
搜索结果1205a-1205e表示本体115的鸟类别,因为已经为文本区域1005中所输入的查询增补了与鸟类别相关联的关键字。关键字可以被添加到查询,作为与典型地表示在指定查询的时间段期间所接收的查询的查询类别相关联并且与对应于界面1000的用户的用户类型相关联的结果。除了包括原始查询“eagles”之外,搜索结果1205a-1205e还可以包括一个或多个用于增补原始查询的关键字。
已经为查询所增补的关键字可以被从其接收该查询的用户感觉到也可以不被该用户感觉到。因此,在文本区域1005中,查询可以被修改也可以不被修改,虽然在所示的搜索工具用户界面1000中的文本区域中已经修改了查询。
所示的输入到文本区域1005中的搜索查询可以已经部分地或完全地被界面1000的用户指定。例如,用户可以仅仅指定原始查询(例如“eagles”),而查询的剩余部分可以已经作为为与查询的特定类别相关联的关键字被自动地添加。在一个实施例中,用户可以删除一个或多个已经被添加到查询的关键字。在这样的实施例中,例如,如果重新检索查询的搜索结果,则被删除的关键字不可以被再次添加到查询。换句话说,在已经为查询增补关键字一次之后,该关键字将不会被再次添加到查询。因此,使得用户能够控制哪些关键字被包括为其检索搜索结果的最后查询中。
参考图13,过程1300被用于为在一个时间段期间从特定类型的用户从表示典型地对应于在该时间段期间和该特定类型的用户所提交的查询的类别的源中检索搜索结果。过程1300表示图6的过程600的一个实施例。过程1300由搜索引擎执行,诸如图1A的搜索引擎110,或图1B的搜索引擎165a-165n中之一,或者由搜索接口执行,诸如图1B的搜索接口160。为了便于讨论,过程1300将被描述为由搜索引擎来执行。
对于所接收的搜索查询,搜索引擎标识表示在由从其接收该搜索查询的用户的类型的用户接收该搜索查询的时间段期间所提交的典型搜索查询的类别(1305)。这样的操作可以以与图6的过程600类似方式执行。
搜索查询标识表示所标识类别的搜索结果的源(1310)。这些源可以与用于标识类别的本体中所标识的类别相关联,诸如本体165。搜索引擎从所标识的源中为所接收的搜索查询检索搜索结果(1315)。例如,搜索引擎可以提交搜索查询到每一个所标识的源,并且可以从每个所标识的源接收搜索结果。替换地或附加地,搜索引擎可以本地地从所标识的源中标识和检索搜索结果。搜索引擎可以将从所标识的源中所接收的搜索结果集合合并。例如,搜索引擎可以删除重复的搜索结果,并且可以对合并后的搜索结果排序。搜索引擎提供所检索的搜索结果,以呈现给提供搜索查询的用户(1320)。
参考图14,搜索工具用户界面1400类似于图10和图12的搜索工具用户界面1000。搜索工具用户界面1400包括文本区域1405,用户可以向该文本区域1405输入搜索查询,还包括按钮1410,该按钮1410可以被选择以为所输入的查询检索搜索结果1415a-1514f。如图所示,用户已经在文本区域1405中输入“eagles”,并且按钮1410已经被选择以检索搜索结果1415a-1514f。搜索工具用户界面1400还包括标识与所输入的查询相关联的查询类别的类别标识器1420a-1420c,和标识对应于由类别标识器1420a-1420c所标识的类别的信息源的信息源指示符1425a-1425j。
类别标识器1420a-1420c指示在文本区域1405中所输入的查询与本体170中的多个类别相关联。更具体而言,查询与音乐类别相关联,如类别标识器1420a所示,与鸟类别相关联,如类别标识器1420b所示,与足球类别相关联,如类别标识器1420c所示。查询可以被解析指向由类别标识器1420a-1420c所标识的类别中仅仅一个。查询被解析到的类别可以是典型表示在文本区域1405中指定查询和按钮1410被选择的时间段期间所提交的查询和指定该查询的用户类型的类型。替换地或附加地,查询被解析到的类别可以是已经被界面1400的用户选择的多个类别中的一个。例如,支持选择多个类别中一个的界面可以在呈现界面1400之前被呈现给用户。于是,查询可以被提交给一个或多个对应于查询被解析到的类别或对应于为查询所选择的类别的信息源,以便从这些信息源检索搜索结果1405a-1405f。
信息源指示符1425a-1425j标识对应于查询被解析到的查询类别的信息源。更具体而言,信息源指示符1425a-1425j标识对应于查询被解析到的鸟类别的信息源。信息源指示符1425a-1425b中每一个对应于来自图2A和2B的示例性本体115的示例性鸟类别205m的图3A中专家域列表320a中所列出的专家域。
已经从从其显示信息源指示符1425a-1425j的信息源中一个中检索搜索结果1415a-1415f中每一个。因为从对应于鸟类别的一个或多个信息源检索搜索结果1415a-1415f,因此搜索结果1415a-1415f都表示鸟类别。此外,选择信息源指示符1425a-1425j中一个可以使仅仅来自相应信息源的搜索结果被检索并且被排他地或相对于来自其他源的结果明显可视偏好地或相对顺序地被显示,这进一步确保了在上述例子中搜索结果表示鸟类别。
在一些实施例中,查询可以被提交给对应于用户并不关心的类别的信息源。例如,查询可以被提交给与鸟类别相关联的信息源,即使对于该查询来说,用户可能并不关心鸟类别。在这样的情况下,类别标识器1420a和1420c可以被选择以指示要检索分别表示音乐类别和足球类别的搜索结果。选择类别标识器1420a和1420c中一个可以导致提交查询到一个或多个对应于所选择类别标识器的类别的信息源。此外,选择类别标识器1420a和1420c其中一个可以使一组标识对应于所选择的类别的信息源的信息源指示符被显示在界面1400上。新展现的信息源指示符可以以类似于信息源指示符1425a-1425j的方式被选择。此外,当选择类别标识器1420a和1420c其中一个时,可以从界面1400中删除信息源指示符1425a-1425j。
参考图15,过程1500被用来基于要被存储到缓冲存储器中的电子内容的类别管理缓冲存储器。更具体而言,电子内容包括在缓冲存储器内可以以电子内容表示典型地表示在内容可以被可以为其缓存该内容的用户类型缓存的时间段期间所提交的搜索查询的类别为条件。
例如,当确定是否在2到3 P.M.之间为十几岁男孩缓存与视频游戏有关的网页时,可以执行过程1500。搜索查询日志可以指示由十几岁的男生在2和3 P.M.所提交的查询通常与视频游戏相关。因为十几岁的男生在2到3 P.M.之间通常搜索与视频游戏相关的电子内容,所以在2到3 P.M.之间,该网页可以被包括在缓冲存储器中以用于十几岁的男生。替换地,日志可以指示在2到3 P.M.之间由十几岁男生所提交的查询通常涉及数学,在该情况下,该网页不会在2到3 P.M.之间被缓存用于十几岁男生。
过程1500可以由维护缓冲存储器的系统执行。例如,电子内容可以是为搜索查询所检索的搜索结果,并且搜索结果可以由检索搜索结果的搜索引擎缓存,诸如图1A的搜索引擎,或者由提供搜索结果的搜索接口缓存,诸如图1B的搜索接口。替换地,电子内容可以由将电子内容提供到的客户系统缓存,诸如图1A的客户系统105或图1B的客户系统155。为了便于描述,过程1500将被描述为由缓存系统执行。
缓存系统接收可以在对应于多个时间段中之一的时刻为对应于多个类型其中一个的用户所缓存的电子内容(1505)。可以缓存电子内容的时间段以及可以为其缓存电子内容的用户的类型的指示可以作为请求的属性与请求相关联。电子内容可以包括网页、e-mail消息,即时消息,文件,或其他电子内容。替换地或附加地,电子内容可以包括响应于由缓存系统所接收的搜索查询而检索的搜索结果。接收电子内容可以包括从电子内容提供者接收内容,或者访问来自提供者的电子内容。
缓存系统标识多个类别中电子内容所对应的类别(1510)。例如,如果电子内容是搜索结果,则缓存系统可以使用本体,诸如图1A的本体115,或图1B的本体170,来标识对应于为其标识搜索结果的搜索查询的类别。替换地或附加地,缓存系统可以将电子内容与和本体中所包括的类别相关联的查询和关键字匹配。如果特定类别对应于包括在电子内容中的查询或关键字,则该特定类别对应于所接收的查询。
缓存系统确定表示在可以为可以为其缓存该电子内容的用户类型缓存该电子内容的时间段期间所提交的典型搜索查询的类别(1515)。这样的操作可以以类似于图6的过程600的方式执行。缓存系统可以将所标识的类别和所确定的类别相比较(1520)。当所标识的电子内容的类别是其中一个所确定的类别时,缓存系统将电子内容包括在缓冲存储器中(1525)。否则,电子内容不被包括在缓冲存储器中。
查询日志始终被描述为包括查询和描述该查询的信息,诸如提交查询的时间和提交查询的用户的属性。在其他实施例中,查询日志还可以包括为查询所检索的一个或多个搜索结果。每个搜索结果可以在查询日志中与提交相应的搜索查询的时间以及描述提交查询的用户的群体信息相关联。以与来自查询日志的查询类似的方式,每个搜索结果可以被处理和用于管理电子内容,如上所述。
所述的用于管理电子内容的技术使用包括提交查询的时间和提交查询的用户的类型的指示的查询日志。在其他实施例中,可以只有这种信息的子集或其他描述查询的信息被包括在查询日志中。例如,描述用于提交查询的计算机系统或应用程序的信息可以被包括在日志中。在管理电子内容时可以考虑这样的附加信息,如上所述。此外,在标识管理电子内容应该采取的恰当方式时,所描述的用于管理电子内容的技术考虑了提交查询和内容请求的时间和提交查询和内容请求的用户的类型。在标识管理电子内容应该采取的恰当方式时,所述技术的其他实施例可以仅仅考虑提交时间和用户类型其中一个。
所述系统、方法和技术可以用数字电子电路、计算机硬件、固件、软件或这些单元的组合来实现。实现这些技术的装置可以包括合适的输入和输出设备、计算机处理器和明确实现在机器可读存储设备中由可编程处理器执行的计算机程序产品。实现这些技术的过程可以由执行指令程序以通过操作输入数据并产生合适的输出而执行期望功能的可编程处理器来执行。这些技术可以被实现为一个或多个计算机程序,这些程序可以在可编程系统上执行,这些可编程系统包括至少一个被耦接以从数据存储系统接收数据和指令并向其发送数据和指令的可编程处理器、至少一个输入设备和至少一个输出设备。每个计算机程序可以用高级程序或面向对象的编程语言实现,或者如果需要的话用汇编或机器语言实现;在任何情况下,语言可以是编译或注释语言。合适的处理器包括例如通用微处理器或专用微处理器。通常,处理器将从只读存储器和/或随机存取存储器接收指令和数据。适于明确实现机器程序指令和数据的存储设备包括所有形式的非易失性存储器,包括例如半导体存储设备,诸如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)和闪速存储设备;磁盘,诸如内部硬盘和可移动盘;磁光盘;和光盘只读存储器(CD-ROM)。任何上述设备可以由特别设计的ASIC(特定用途集成电路)来补充或包含在其中。
应该理解,可以做出各种修改,而不背离权利要求的精神和范围。例如,如果以不同的顺序执行所公开技术的步骤和/或如果所公开系统中的组件以不同的方式组合和/或由其他组件替代和补充,则仍然可以实现上述优点。因此,其他实施例是在以下权利要求的范围内。
权利要求
1.一种用于提供类别特定的电子内容的方法,所述方法包括接收对电子内容的请求,其中所述请求具有属性;比较所接收的请求的属性和与搜索查询日志中所包括的查询相关的属性;基于所检测的与该类别相关联的属性和所接收请求的属性之间的关系访问类别的指示;访问并提供表示所标识类别的电子内容。
2.根据权利要求1的方法,还包括呈现所访问的内容。
3.根据权利要求1的方法,其中接收对电子内容的请求包括接收对具有标识提交请求的时间段的属性的电子内容的请求;比较所接收请求的属性和搜索查询日志中所包括的查询的属性包括比较标识所述时间段的属性和标识提交查询的时间段的来自搜索查询日志的查询的属性;和访问类别的指示包括基于所检测的与所述类别相关联的时间段和由请求属性所标识的时间段之间的匹配来访问类别的指示。
4.根据权利要求3的方法,其中来自查询日志的查询的属性标识提交所述查询所在的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的星期、一年中的星期或一年中的月;和所接收请求的属性标识提交所接收请求所在的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的星期、一年中的星期或一年中的月。
5.根据权利要求1的方法,其中接收对内容的请求包括接收对具有标识提交请求的用户的特性的属性的电子内容的请求;比较所接收请求的属性和搜索查询日志中所包括的查询的属性包括比较标识用户特性的属性和标识提交查询的用户的特性的来自搜索查询日志的查询的属性;和访问类别的指示包括基于所检测的与类别相关联的用户特性和由请求属性所标识的用户特性之间的匹配来访问类别的指示。
6.根据权利要求5的方法,其中来自查询日志的查询的属性标识提交查询的用户的性别、提交查询的用户的年龄、或提交查询的用户的位置;和所接收请求的属性标识提交所接收请求的用户的性别、提交所接收请求的用户的年龄、或提交所接收请求的用户的位置。
7.根据权利要求1的方法,其中接收对电子内容的请求包括接收对包括广告的电子内容的请求;和访问电子内容包括访问对应于所标识类别的广告。
8.根据权利要求1的方法,其中接收对电子内容的请求包括接收要为其检索搜索结果的搜索查询;和访问所请求的电子内容包括访问表示为所接收搜索查询所标识的类别的搜索结果。
9.根据权利要求8的方法,其中访问搜索结果包括格式化查询以表示所标识的类别;和为格式化后的查询检索搜索结果。
10.根据权利要求9的方法,其中格式化查询包括为查询增补表示所标识类别的附加信息。
11.根据权利要求10的方法,其中增补查询包括将查询格式化成所标识类别的查询的规范格式。
12.根据权利要求10的方法,其中增补查询包括为查询增补一个或多个表示所标识类别的关键字。
13.根据权利要求8的方法,其中访问搜索结果包括将搜索查询路由到至少一个表示所标识类别的搜索结果的源;和从所述至少一个源接收针对该搜索查询的搜索结果。
14.根据权利要求8的方法,其中访问搜索结果包括标识所接收的搜索查询所对应的两个类别;比较所述两个类别和所指示的类别;和标识所述两个类别中匹配所指示类别的一个类别。
15.根据权利要求1的方法,其中访问类别的指示包括访问很可能表示来自日志的、属性与所接收请求的属性匹配的查询的类别的指示。
16.根据权利要求1的方法,还包括为每个属性,标识来自查询日志的具有所述属性的查询;为每个所标识的查询,标识对应于所标识查询的类别;为每个对应于所标识的查询中一个的类别,标识所述类别对应于所标识查询中一个的概率;和其中,访问类别指示包括访问具有高概率的类别的指示。
17.根据权利要求16的方法,其中标识对应于所标识查询的类别包括为每个类别,访问对应于所述类别的查询的列表;和当所标识查询的至少一部分匹配类别的查询列表中所包括的查询中一个的至少一部分时,标识所述类别为对应于所标识的查询。
18.根据权利要求1的方法,其中访问类别的指示包括访问搜索查询日志,其中每个所述搜索查询具有属性;标识来自日志的、属性与所接收请求的属性匹配的查询;和标识对应于所标识查询的类别。
19.根据权利要求1的方法,其中访问类别的指示包括访问具有条目的表格,其中每个条目与一个属性和表示来自搜索查询日志的与所述属性相关的搜索查询的类别相关联;标识所述表格中与所接收请求的属性相关联的条目;和标识与表格中所标识的条目相关联的类别。
20.根据权利要求19的方法,其中访问表格包括访问具有条目的表格,其中每个条目与多个属性和表示来自搜索查询日志的与所述多个属性相关的搜索查询的类别相关联;和标识表格的条目包括标识表格中与所接收请求的多个属性相关联的条目。
21.根据权利要求19的方法,其中访问表格包括访问具有条目的表格,其中每个条目与一个时间段和表示来自搜索查询日志的在所述时间段期间所提交的搜索查询的类别相关联;和标识表格的条目包括标识表格中与接收请求的时间段相关联的条目。
22.根据权利要求1的方法,其中请求具有多个属性,搜索查询日志中所包括的每个查询具有多个属性,并且查询日志中所包括的每个查询由多个类别表示;接收对电子内容的请求包括接收对具有多个属性的电子内容的请求;比较所接收请求的属性和与搜索查询日志中所包括的至少一个查询相关的属性包括比较所接收请求的属性和与搜索查询日志中所包括的查询相关的属性;和访问类别的指示包括基于所检测的与多个类别相关联的属性和所接收请求的属性之间的关系来访问多个类别的指示。
23.一种缓存电子内容的方法,所述方法包括接收电子内容以包括在缓冲存储器中,其中所述电子内容具有属性;标识所述电子内容所对应的类别;比较所述电子内容的属性和与搜索查询日志中所包括的查询相关的属性;基于所检测的与该类别相关联的属性和所述电子内容的属性之间的关系,访问类别的指示;比较所标识的类别与所指示的类别;和当所标识的类别匹配所指示的类别时,将所述电子内容包含在缓冲存储器中。
24.根据权利要求23的方法,其中接收电子内容包括接收具有标识可以缓存该电子内容的时间段的属性的电子内容;比较电子内容的属性和搜索查询日志中所包括的查询的属性包括比较标识所述时间段的属性和标识提交查询的时间段的来自搜索查询日志的查询的属性;和访问类别指示包括基于所检测的与所述类别相关联的时间段和所述电子内容的属性的时间段之间的关系来访问类别的指示。
25.根据权利要求24的方法,其中来自查询日志的查询的属性包括标识提交查询所在的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的星期、一年中的星期或一年中的一个月;和电子内容的属性标识可以缓存所述电子内容的一天中的小时、一个星期中的一天、一个月中的一天、一年中的一天,一个月中的星期、一年中的星期或一年中的一个月。
26.根据权利要求23的方法,其中接收电子内容包括接收具有标识提交请求的用户的特性的属性的电子内容;比较电子内容的属性和搜索查询日志中所包括的查询的属性包括比较标识用户特性的属性和标识提交查询的用户的特性的来自搜索查询日志的查询的属性;和访问类别指示包括基于所检测的与类别相关联的用户特性和由所述电子内容的属性所标识的用户特性之间的关系来访问类别的指示。
27.根据权利要求26的方法,其中来自查询日志的查询的属性标识提交查询的用户的性别、提交查询的用户的年龄、或提交查询的用户的位置;和电子内容的属性标识可以为其缓存所述电子内容的用户的性别、可以为其缓存所述电子内容的用户的年龄、或可以为其缓存所述电子内容的用户的位置。
28.根据权利要求23的方法,其中电子内容包括为搜索查询所检索的表示电子内容的所标识类别的搜索结果。
29.根据权利要求23的方法,还包括标识来自查询日志的、属性与所述电子内容的属性匹配的查询;为每个所标识的查询,标识所标识的查询所对应的类别;为每个对应于所标识查询中一个的类别,标识所述类别对应于所标识查询中一个的概率;并且其中访问类别指示包括访问具有高概率的类别的指示。
30.根据权利要求29的方法,其中标识对应于所标识查询的类别包括为每个类别,访问对应于所述类别的查询列表;和当所标识的查询的至少一部分匹配对应于类别的查询列表中所包括的一个查询的至少一部分时,标识所述类别为对应于所标识的查询。
31.根据权利要求23的方法,其中电子内容具有多个属性,搜索查询日志中所包括的每个查询具有多个属性,电子内容由多个类别表示,并且查询日志中所包括的每个查询由多个类别表示,其中接收电子内容包括接收具有多个属性的电子内容;标识电子内容所对应的类别包括标识电子内容所对应的多个类别;比较电子内容的属性和搜索查询日志中所包括的查询的属性包括比较电子内容的多个属性和搜索查询日志中所包括的查询的多个属性;并且访问类别的指示包括基于所检测的与类别相关联的多个属性和所述电子内容的多个属性之间的关系来访问类别的指示。
32.一种存储在计算机可读介质或传播信号上的计算机程序,其中所述计算机程序在被执行时在显示设备上生成图形用户界面,所述图形用户界面包括第一电子内容的满足具有第一属性的请求而呈现的第一显示;第二电子内容的满足具有第二属性的请求而呈现的第二显示;其中,第一电子内容包括表示代表与第一属性相关的典型查询的来自查询日志的查询的类别的广告,第二电子内容包括表示代表与第二属性相关的典型查询的来自查询日志的查询的类别的电子内容。
33.根据权利要求32的计算机程序产品,其中第一属性匹配第二属性。
34.根据权利要求32的计算机程序产品,其中第一属性不同于第二属性。
全文摘要
提供类别特定的电子内容包括接收对电子内容的请求。请求具有属性。比较所接收请求的属性和与搜索查询日志中所包括的查询相关的属性。基于所检测的与该类别相关联的属性和所接收请求的属性之间的关系,访问类别的指示。访问并提供表示所标识类别的电子内容。缓存电子内容包括接收电子内容以包含在缓冲存储器中,其中电子内容具有属性,标识电子内容所对应的类别。访问表示与匹配该电子内容的属性的属性相关的来自搜索查询日志的查询的类别的指示。当所标识的类别匹配所指示的类别时,将电子内容包含在缓冲存储器中。
文档编号G06F17/30GK101044478SQ200580029182
公开日2007年9月26日 申请日期2005年7月1日 优先权日2004年7月1日
发明者阿卜杜尔·R·乔杜里 申请人:奥尔有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1