用于提供高级搜索结果页面内容的系统和方法

文档序号:6350464阅读:163来源:国知局
专利名称:用于提供高级搜索结果页面内容的系统和方法
技术领域
这里描述的发明的实施例概括来说涉及提供位于搜索结果页面(“SRP”)上的高级内容。更具体而言,本发明的实施例针对的是用于分析用户查询相关数据并且提供位于 SRP内的多个新颖的交互式控件或应用的系统和方法。
背景技术
随着因特网持续以指数方式扩张,搜索引擎的作用剧烈地増大了。巨大量的数据已迅速变得让人类用户不可能自己来操纵。从而,对搜索引擎技术的使用已成为了因特网的有用操作中的至关重要的工具。在针对响应于查询而返回的结果的质量来优化搜索引擎方面,已取得了很大的进展。当前存在的算法使用户通常可以在提交查询后的数秒内就识别出相关的网站。然而, 尽管有这些进步,但在分析特定或聚合用户行为并且在SRP上直接向用户提供容易访问的数据方面,取得的进步仍很小。作为示例,当前的现有技术未能充分利用在搜索引擎结果页面内存在的语义数据 (semantic data)。当前,包括几乎所有最频繁访问的站点在内的许多网站都包含诸如RDF/ XML、N3等等之类的语义数据,即可被提取并解析成最终用户容易访问的格式的数据。此外, 许多常见的搜索查询可能不是满足于网站,而是满足于直接提供给用户的简单应用或窗ロ 小部件(widget)。因此,当前存在对于智能的、以用户为中心的捜索结果页面的需求。

发明内容
本发明针对的是用于响应于搜索请求而提供ー个或多个方面的系统和方法,所述 ー个或多个方面包括搜索结果的额外精炼(refinement)以及允许用户访问精炼的数据和其他对象的用户界面组件。在一个实施例中,生成搜索结果包括接收包括至少ー个搜索词语(search term) 的搜索请求并且基于此搜索请求访问涉及web内容的数据的语料库(corpus)以确定用于包括在捜索结果集合中的相关内容。捜索结果的生成还包括基于对搜索结果集合的审查而确定至少ー个枢轴数据点(Pivot data point),该至少一个枢轴数据点与捜索结果集合是上下文相关的。对于给定的数据点,该系统和方法基于该数据枢轴点生成用于搜索结果集合的精炼的活动数据链接(active data link)并且生成用于搜索结果集合的至少一部分和活动数据链接的呈现的捜索结果输出显示。其中,该方法和系统支持响应于对枢轴数据点之一的活动数据链接的选择而切換该搜索结果输出显示以呈现搜索结果集合的精炼的至少一部分。在一个实施例中,生成捜索结果包括接收包括至少ー个捜索词语的搜索请求并且基于搜索请求访问涉及web内容的数据的语料库以确定用于包括在结果集合中的相关内容。捜索结果的生成包括基于对搜索结果集合的审查而确定搜索结果集合中的至少ー个语义对象,该语义对象是关联并包含在web内容内的有关数据。该方法和系统基于该至少一个语义对象生成对象过滤器并且生成用于搜索结果集合的至少一部分和用于ー个或多个语义对象的活动数据链接的呈现的捜索结果输出显示。其中,该方法和系统支持响应于对给定的活动数据链接的选择而切換该搜索结果输出显示以呈现搜索结果集合的子集的至少一部分,该搜索结果的子集包括具有与之相关联的语义对象的web内容。在一个实施例中,生成捜索结果包括接收包括至少ー个捜索词语的搜索请求并且基于搜索请求访问涉及Web内容的数据的语料库以确定用于包括在捜索结果集合中的相关内容。该方法和系统包括确定与搜索请求相关联的多个应用并且生成用于呈现捜索结果集合的至少一部分和应用的至少一部分的捜索结果输出显示。于是,该方法和系统生成改善的捜索結果,包括上下文枢轴数据点、语义对象过滤和查询触发的应用显示。


在意欲为示例性而非限制性的附图中图示了本发明,在附图中相似的标号想要指代相似或相应的部件,附图中图1呈现了示出根据本发明一个实施例的用于提供查询触发的应用的系统的框图;图2呈现了示出根据本发明一个实施例的用于提供基于查询的枢轴数据点的系统的框图;图3呈现了示出根据本发明一个实施例的用于在搜索数据库中识别语义对象并且提供语义对象上下文链接的系统的框图;图4呈现了图示根据本发明一个实施例的用于提供查询触发的应用的方法的流程图;图fe呈现了图示根据本发明一个实施例的用于提供与捜索结果集合相关联的枢轴数据点的方法的流程图;图恥呈现了图示根据本发明一个实施例的用于检索与枢轴数据点相关联的捜索结果的方法的流程图;图6a呈现了图示根据本发明一个实施例的用于分析捜索数据库并且识别语义对象的方法的流程图;图6b呈现了图示根据本发明一个实施例的用于从多个搜索结果中提取语义对象识别信息并且向用户提供语义类别链接的方法的流程图;图7呈现了图示根据本发明一个实施例的捜索结果页面的屏幕图;图8呈现了图示根据本发明一个实施例响应于对枢轴数据点的选择而检索到的多个搜索结果的屏幕图;并且图9呈现了图示根据本发明一个实施例响应于对语义类别链接的选择而检索到的多个搜索结果的屏幕图。
具体实施例方式在以下描述中,參考了形成描述的一部分的附图,在附图中以图示方式示出了可以实现本发明的具体实施例。要理解,在不脱离本发明的范围的情况下,可以利用其他实施例,并且可以作出结构改变。图1呈现了示出根据本发明一个实施例的用于提供查询触发的应用的系统的框图。如图1的实施例所示,多个客户端设备102、104和106经由网络108连接到捜索提供商110。捜索提供商110包括web服务器112、搜索引擎114、捜索数据库116、SRP应用服务器118以及SRP应用数据库120。SRP应用服务器118包括查询检查器122、查询解析器 124、数据库接ロ 1 以及应用加载器128。就这里使用的而言,应用可以是任何能够直接与其他计算机通信的软件实现;供用户与之交互的动态界面(以及静态呈现);以及访问数据的语料库,该数据独立于用于生成算法捜索结果的数据。客户端设备102、104和106可以是具有中央处理单元、存储器単元、永久存储装置、音频/视频输出设备、网络接ロ等等的通用计算设备(例如个人计算机、电视机顶盒、移动设备等等)。客户端设备102、104和106可操作来经由网络108通信,网络108可以是局域网或广域网,例如因特网。在本实施例中,客户端设备102、104和106经由HTTP、WAP或类似的用于文本、图像和其他数据的客户端/服务器交換的协议向内容提供商110发送请求。客户端设备102、104和106可操作以向搜索提供商110发送对于搜索结果的请求,这些搜索请求包括捜索词语。这些词语可以是用户生成的捜索词语,或者可以是用户辅助的即建议的捜索词语。在一个实施例中,客户端设备102、104和106可操作以发送包含文本查询串的HTTP请求。例如,操作客户端设备102、104和106的用户可输入带有搜索词语的查询串,例如“sushi in new york,ny”,并且经由HTML表单元素提交查询。捜索提供商110经由web服务器112接收来自客户端设备的查询。在一个实施例中,web服务器112可包括各种硬件组件,这些硬件组件运行web服务器软件,例如APACHE HTTP SERVER、MICROSOFT IIS或者任何其他适当的web服务器软件。web服务器112提取查询串并且生成要被发送到搜索引擎114的搜索引擎请求。 捜索引擎114可包括可操作以接收对搜索结果的请求、优化搜索算法并从搜索数据库116 提取数据的各种硬件和软件组件。可以采用的各种搜索引擎技术是本领域中公知的,在这里为了简明起见不作论述。搜索引擎114从搜索数据库116检索多个搜索結果。在一个实施例中,捜索数据库116可包括多个索引,用于允许访问所存储的与给定查询相关联的资源识别符。在检索到多个搜索结果之后,捜索引擎114将这些结果发送回web服务器112。除了检索多个搜索结果以外,web服务器112还可操作以将接收到的查询发送到 SRP应用服务器118。在一个实施例中,SRP应用服务器可包括可操作以在SRP应用数据库 120与web服务器112之间传送和处理数据的单个应用服务器或多个应用服务器。当SRP应用服务器118接收到来自web服务器112的查询时,查询检查器122对
6查询串执行初始预处理。在一个实施例中,预处理可包括查询串的格式化(例如去除空格、 改写)、词语替换(例如用适当的通用词语替换晦涩的词语)、查询分类、实体识别、或者本领域中已知的其他查询解析技木。查询检查器122可通信地耦合到查询解析器124。查询解析器IM可将经预处理的查询分解成离散的关键字成分并且将这些关键字成分发送到数据库接ロ 126。在图示实施例中,数据库接ロ 1 接收关键字成分并且制定正规的数据库请求。例如,数据库接ロ 1 可操作以检索出多个预定义的请求模板以访问SRP应用数据库120。响应于接收到多个关键字,数据库接ロ 1 可选择适当的请求模板并且将请求发送到SRP应用数据库120。SRP应用数据库120可包括一个或多个数据库,其中每个数据库可操作以存储与 SRP应用有关的信息。在一个实施例中,SRP应用数据库120包括存储与应用相关联的元数据(例如标题、关键字等等)的索引数据库以及存储与给定应用相关联的可执行代码的应用数据库。数据库接ロ 1 可从SRP应用数据库120接收应用数据并将接收到的数据转发到应用加载器128。在一个实施例中,应用加载器1 可操作以将接收到的应用数据格式化并封装成适于包括在SRP上的格式。例如,应用加载器1 可填充与应用相关联的任何可变数据,例如广告数据、当前时间数据或任何其他可在运行时确定的数据。应用加载器1 还可操作以将封装的(ー个或多个)应用发送回web服务器112。 作为响应,web服务器112可以将这(ー个或多个)应用封装与先前接收到的捜索结果相組合。在一个实施例中,将(ー个或多个)应用与搜索结果相组合可包括识别预定义的SRP 模板的区段并将搜索结果和(ー个或多个)应用置入相应的模板位置中。如下文更详细论述的,应用在被加载时可将额外的信息利用于执行,这在ー个实施例中包括其上显示SRP 的处理系统本地的数据。注意,另ー实施例可包括直接显示或启动应用,省略捜索结果或者在次显示或其他辅助显示中显示搜索結果。图2呈现了示出根据本发明一个实施例的用于提供基于查询的枢轴数据点的系统的框图。如图2的实施例所示,多个客户端设备202、204和206经由网络208连接到搜索提供商210。根据图2的实施例,捜索提供商210包括web服务器212、捜索引擎214、搜索数据库216以及枢轴服务器218。枢轴服务器218包括捜索结果解析器220、查询处理器 222、枢轴度量存储装置224以及枢轴封装器226。总地来说,客户端设备202、204和206关于向web服务器212、搜索引擎214和搜索数据库216请求搜索结果的操作与关于元件102、104、106、112、114和116的操作基本上类似,为了简明将不再重复。在图2的实施例中,web服务器212还可操作以将检索到的捜索结果发送到枢轴服务器218。在图示实施例中,捜索结果可被捜索结果解析器220接收。捜索结果解析器220 对接收到的捜索结果执行解析操作,例如按域或其他枢轴点对搜索结果分組。捜索结果解折器220随后将经解析的结果发送到查询处理器222。在一个实施例中,查询处理器222接收来自web服务器212的所提交的查询以及经解析的捜索結果。查询处理器222可操作以基于经解析的捜索结果从枢轴度量存储装置 224中提取多个枢轴度量并且生成多个枢轴数据点。例如,枢轴度量存储装置2M可包含将被应用到给定的枢轴数据点的域特定属性(例如,域特定捜索查询參数)。此外,查询处理器222可操作以分析给定的查询以进ー步精炼所选择的枢轴数据点。例如,查询处理器 222可操作以将查询的类型分类为针对购物、旅行、大众等等。此分类可用于缩窄枢轴数据点的列表。例如,与购物有关的搜索可允许查询处理器222在识别域特定枢轴数据点时忽略来自社交网络站点的結果。在检索出多个枢轴数据点之后,查询处理器222可将这些枢轴数据点发送到枢轴封装器226。就这里使用的而言,枢轴数据点是基于特定数据精炼捜索的数据点,例如精炼到特定的web位置的示例,这是示例性的而不是限制性的示例。在一个实施例中,枢轴封装器2 可负责准备枢轴数据点以用于插入到SRP中。例如,枢轴封装器2 可操作以构造枢轴数据点的表示,其中包括与数据枢轴点相关联的图像、Javakript和活动数据链接(例如HTML超链接)。枢轴封装器2 还可操作以将封装的(ー个或多个)枢轴封装发送回web服务器 212。作为响应,web服务器212可将这(ー个或多个)枢轴封装与先前接收到的捜索结果相組合。在一个实施例中,将(ー个或多个)枢轴封装与搜索结果相组合可包括识别预定的SRP模板的区段并将搜索结果和(ー个或多个)枢轴封装置入相应的模板位置中。SRP 的示例性实施例将联系图7至9以及图4的流程图来进一歩论述。图3呈现了示出根据本发明一个实施例的用于在搜索数据库中识别语义对象并且提供语义对象上下文链接的系统的框图。如图3的实施例所示,多个客户端设备302、304 和306经由网络308连接到搜索提供商310。根据图3的实施例,搜索提供商310包括web 服务器312、搜索引擎314、捜索数据库316、语义对象服务器318以及语义对象数据库320。 语义对象服务器318包括搜索结果加载器322、语义对象提取器324、语义对象规则存储装置326、查询加载器328、数据库接ロ 330以及语义对象封装器。总地来说,客户端设备302、304和306关于向web服务器312、搜索引擎314和搜索数据库316请求搜索结果的操作与关于元件102、104、106、112、114和116的操作基本上类似,为了简明起见将不再重复。语义对象服务器318管理位于搜索数据库中存储的捜索结果内的语义对象数据。 语义对象服务器318还可操作以处理响应于包括搜索词语的搜索查询对语义对象数据的管理和检索。在一个实施例中,搜索结果加载器322可操作以从搜索数据库316接收搜索結果。 在一个实施例中,捜索数据库316可将未经分析的捜索结果传送到搜索结果加载器322。例如,在最终确定爬取到的捜索结果之前,捜索数据库316可将搜索结果发送到捜索结果加载器322以便处理。或者,搜索结果加载器322可从搜索数据库316拉来搜索结果并且控制对搜索结果的分析。搜索结果加载器322将搜索结果发送到语义对象提取器324。在图示实施例中,语义对象提取器3M从语义对象规则存储装置3 中检索出语义对象定义。语义对象定义可包括根据与语义数据相关联的已知技术描述语义数据的格式的结构化数据。例如,语义对象定义可描述语义对象内的字段和參数。在访问语义对象定义之后,语义对象提取器3M分析给定的捜索结果并且确定在该搜索结果内是否存在ー个或多个语义对象。在一个实施例中,语义对象提取器3M解析捜索结果的关联页面的内容(例如HTML源代码)并且识别与语义对象定义描述的模式匹配的页面内容。如果语义对象提取器3M检测到与语义对象的ー个或多个匹配,则语义对象提取器3M从语义对象数据库320中检索出预定义的语义对象。在一个实施例中,语义对象数据库320可存储包括图像数据、可执行代码数据和标记数据的多个预定义的语义对象组件。语义对象服务器318还可通过查询加载器3 处理用户查询以确定语义对象定义是否对应于用户查询。例如,查询加载器3 可确定所提交的用户查询可能针对的是视频捜索結果。在此实施例中,查询加载器3 可分析查询关键字并且查询语义对象数据库320 以确定相关联的捜索结果是否包含适当的语义对象。例如,对“pearl jam”的用户查询可导致对视频对象的语义对象匹配。在此示例中,数据库接ロ 330可查询语义对象数据库320 以确定在针对查询“pearl jam”的搜索结果内是否存在任何视频对象。在替换实施例中,语义对象服务器318可分析针对给定查询的捜索结果以在不分析用户查询的情况下确定是否存在语义对象。例如,语义对象服务器318可将搜索结果与语义对象数据库320内的条目相对照,并且确定在搜索结果内存在哪些语义对象。在另ー 实施例中,语义对象与结果一起返回,并且系统在代理中使用应用逻辑来基于返回什么结果和对象确定要做什么。当语义对象服务器318确定在捜索结果集合内存在语义对象吋,语义对象封装器 332封装语义对象过滤器。在一个实施例中,语义对象过滤器可包括多个组件,其中包括识别语义对象的活动数据链接、各种图像元素以及用于描述对象过滤器的外观的标记语言。 在替换实施例中,语义对象服务器318还可操作以确定应当或不应当示出什么对象。例如, 语义对象服务器318可利用预定的基于场景的阈值来确定要显示的语义对象过滤器的数目。或者,可以使用各种其他度量来限定所显示的结果的数目。语义对象封装器332还可操作以将封装的(ー个或多个)对象发送回web服务器 312。作为响应,web服务器312可将封装的(ー个或多个)对象与先前接收到的捜索结果相組合。在一个实施例中,将封装的(ー个或多个)对象与搜索结果相组合可包括识别预定义的SRP模板的区段并将搜索结果和(ー个或多个)封装的对象置入相应的模板位置中。虽然被图示为三个不同的环境,但服务器118、218和318也可与web服务器、搜索引擎和搜索数据库同时操作。在此实施例中,服务器118、218和318可全都通信地耦合到 web服务器、搜索引擎和搜索数据库并且可同时执行上述处理。在另外的环境中,图1至3还可包括位于搜索提供商110、210和310处的拍卖服务器,用干与广告主通信。在此实施例中,广告主可提交应用、枢轴封装、语义对象和要包括在SI^R上的其他对象。例如,广告主还可对所提交的应用的置入竞价,类似于关于SRP上的广告置入的当前广告体系结构。另外,图1至3中描述的系统可与其他查询处理技术相組合。例如,上述服务器可与诸如会话数据分析应用之类的基于历史的处理应用协カエ作。在此实施例中,系统可操作以分析在给定时间段中用户的过去历史以确定给定搜索的上下文。例如,在捜索“cars”、 “buick”和“ ford”之后对“jaguar”的搜索可表明用户不是对动物感兴趣,而是对JAGUAR 汽车感兴趣。从而,系统可限制上述系统聚焦干与汽车相关联的枢轴数据项、语义对象过滤器或应用。
图4呈现了图示根据本发明一个实施例的用于提供查询触发的应用的方法的流程图。在一个实施例中,图4的方法可在图1的系统100内执行。根据图4所示的实施例, 方法400接收并解析捜索查询,步骤400。在图示实施例中,如本领域中已知的,方法可经由HTTP请求从利用搜索门户的最终用户接收搜索查询。方法400随后可根据预定义的ー 组规则来解析捜索查询。例如,方法400可修整掉查询中的无用或空格字符或者本领域中已知的其他预处理算法。方法400随后识别相关查询关键字,步骤404。在此步骤中,方法400通过分析关键字的字词以及它们的句法放置来智能地确定用户查询的上下文和意图。例如,诸如 "mortgage calculator”之类的平凡查询可被识别为与关于抵押贷款的计算器应用相关联。诸如“sushi restaurants in new york,ny”之类的更复杂的示例可识别三个一般关键字企业的类型(餐馆)、企业的“种类”或行业(寿司)以及位置关键字(纽约市)。在替换实施例中,方法400可将这三个关键字进ー步解析为诸如“餐馆”之类的一般应用识别符。在另ー实施例中,方法400可智能地将查询变换成相关联的主題。例如,如果用户输入查询“2+2”,则方法400可确定用户的查询是针对数学计算器的。在识别出查询关键字之后,方法400查询应用数据库,步骤406。在一个实施例中, 方法400可利用预定义的数据库接ロ来提取数据库内的与所识别的关键字相关联或者是所识别的关键字的相似匹配的应用。在一个实施例中,方法400还可基于将查询与给定应用的描述相比较来确定置信值。如果对于所识别的关键字没有找到应用,步骤408,则方法只是提供匹配的搜索结果,步骤410。例如,如果用户查询针对的是缺乏应用的模糊主題,则方法400可能找不到任何与关键字相关联的应用。如果方法400确定对于用户查询存在应用,则这里的方法将应用和捜索结果提供给用户,步骤412。在一个实施例中,提供应用可包括提供嵌入在捜索结果页面内的经封装的应用对象。方法400提供应用和捜索结果给用户并且监视应用以确定用户是否选择了应用, 步骤414。选择应用可包括用鼠标点击对象、输入键击或者本领域中已知的任何用户输入动作。在一个实施例中,监视用户交互可经由诸如Jav必cript、FlaSh或类似的客户端侧技术之类的客户端侧可执行代码来完成。如果方法400确定用户选择了应用,则方法在用户设备上执行该应用,步骤416。 在一个实施例中,执行应用可包括从本地存储装置加载应用。例如,应用可被嵌入在SRP 上,但是非活动的。响应于选择该应用,方法400简单地激活并显示该应用。在替换实施例中,方法400可响应于用户选择而访问远程存储装置。在此实施例中,方法400可异步地检索应用数据并且在接收到后可执行该应用。应用可在SRP内执行或者可在単独的显示中执行。如果可能,应用的执行可利用本地数据。例如,如果用户有应用可使用的现有数据,例如先前输入的信息或简档信息,则应用可与本地存储装置交互以改善用户功能。注意,此查询触发应用响应可基于非web内容数据。例如,在一个实施例中,可对包括第三方数据馈送在内的数据馈送执行搜索。在此实施例中,方法包括注册包括第三方数据馈送在内的多个数据馈送并且创建用于馈送数据的持久型存储库,该存储库存储并更新馈送数据。另外,馈送数据可包括但不限于给定域中的条目的列表以及关于这些条目的元数据。因此,用于生成捜索结果的方法还可包括对数据馈送提出搜索请求。在替换实施例中,捜索操作的额外精炼可包括为给定的查询确定最适当的垂直搜索引擎。这可通过对搜索词语的分析和/或对搜索结果的类型的分析来执行。从而,SRP可包括来自这个最适当的垂直搜索引擎的搜索結果。图fe呈现了图示根据本发明一个实施例的用于提供与捜索结果集合相关联的枢轴数据点的方法的流程图。注意,图如和恥的方法可在图2的系统200内执行。根据图 5a所示的实施例,方法500a接收搜索查询,步骤502。在图示实施例中,如本领域中已知的, 方法500a可经由HTTP请求从利用搜索门户的最终用户接收搜索查询。方法500a随后可检索与查询相关联的捜索結果,步骤504。捜索结果检索技术是本领域中公知的,为了简明起见不再重述。方法500a选择给定的搜索结果并且对结果分类,步骤506。方法500a对搜索结果分类,直到其生成必要数目的捜索结果列表为止,步骤508。在一个实施例中,方法500a可对所有捜索结果分类。在替换实施例中,方法500a可基于预定的阈值量来限制分类的搜索结果的数目。在一个实施例中,对搜索结果分类可包括确定搜索结果的域名。例如,方法500a 可确定属于“example, com”的捜索结果的数目并且可在本地存储此分类数据。在替换实施例中,方法500a可根据任何预定的分类方案来对结果分类。在分类之后,方法500a加载枢轴度量,步骤510。在一个实施例中,枢轴度量可包括与给定的类别相关联的任何元数据。例如,枢轴度量可基于匹配的结果的数目来约束类别的应用。即,仅当匹配的结果的数目超过预定的阈值时,才应用给定的类别。或者,枢轴度量可包括与给定的类别或域相关联的任何元数据。方法500a随后选择经分类的搜索结果的子集,步骤512。选择经分类的搜索结果的子集可包括提取预定阈值限定的前N个类别。例如,方法500a可确定只应当利用前三个类别。方法500a基于经分类的搜索结果来生成枢轴数据点,步骤514。在一个实施例中, 生成枢轴数据点可包括生成可被置入SRP内的独立对象。例如,方法500a可利用枢轴度量数据并且可生成或识别与类别相关联的图像、与枢轴点相关联的HTML活动数据链接以及与枢轴数据点相关联的诸如Javakript之类的关联可执行代码。方法500a可組合这些和各种其他形式的数据以生成独立的枢轴数据点。这里,可基于枢轴数据点生成活动链接,例如该点可以是指定web位置例如“www. example, com”的内容并且活动链接是该枢轴点的可视表示或表现,活动链接被编码到SRP和用户可选择的界面元素中。最后,方法500a在SRP中向用户提供枢轴数据点和捜索結果,步骤516。在ー个实施例中,方法500a将先前生成的枢轴数据点代码嵌入在SRP或SRP模板内,例如嵌入在左边栏中,如以下图7-9中所示。图恥呈现了图示根据本发明一个实施例的用于检索与枢轴数据点相关联的捜索结果的方法的流程图。根据图恥所示的实施例,方法500b如前所述提供枢轴点和搜索结果,步骤518。方法500b随后监视SRP以检测用户对枢轴数据点之一的选择,步骤520。选择应用可包括用鼠标点击对象、输入键击或者本领域中已知的任何用户输入动作。在ー个实施例中,监视用户交互可经由诸如JavaScript、Flash或类似的客户端侧技术之类的客户端侧可执行代码来完成。如果用户未选择枢轴数据点,则方法500b继续提供枢轴数据点,步骤518。如果用户选择了枢轴数据点,则方法请求精炼搜索結果,步骤520。在一个实施例中,请求精炼搜索结果可包括执行由枢轴数据点内的活动数据链接识别的第二捜索查询。在一个实施例中, 第二捜索查询可同步执行,即重加载不同的第二 SRP。在替换实施例中,第二搜索查询可异步执行,即只是重加载搜索結果,而不重加载SRP。方法500b随后呈现精炼的捜索結果,步骤524。如前所述,呈现精炼的搜索结果可包括显示与第一 SRP类似的第二 SRP。在一个实施例中,第二 SRP可包括表明第二 SRP是基于枢轴数据点对第一 SRP的精炼的额外元素。例如,第二 SRP可声称捜索结果被精炼了并且可提供返回到第一 SRP的选项。在一个实施例中,这可以是回复到原始SRP的切換选择。方法500b继续显示精炼的SRP,直到检测到返回请求为止,步骤526。如果方法 500b检测到用户提交了返回请求,则方法呈现原始SRP,步骤528。如前所述,方法500b可经由同步或异步请求呈现原始SRP。还要注意,用户在查看精炼的SRP的同时可通过选择不同的活动数据链接而在不同的枢轴数据点SRP之间切換。图6a呈现了图示根据本发明一个实施例的用于分析捜索数据库并且识别语义对象的方法的流程图。注意,图6a和6b的方法的步骤在一个实施例中可利用图3的系统300 执行。如图6a所示,方法600a检索出多个搜索結果,步骤602。搜索结果检索技术是本领域中公知的,为了简明起见不再重述。方法600a随后选择给定的捜索結果,步骤604,并且继续选择搜索結果,直到不再剩有捜索结果为止,步骤614。在替换实施例中,方法600a 可选择预定数目的捜索结果来处理。在选择搜索结果之后,方法600a尝试识别搜索结果内的语义对象,步骤606。方法 600a可通过将搜索结果数据与存储的语义对象定义的列表相比较来识别语义对象。在此实施例中,方法600a可执行模式匹配算法来确定在搜索结果内是否存在所定义的语义对象。 例如,语义对象定义可规定根据vCard文件格式来格式化的文本数据将被适当地认为是商务名片,从而是可识别的对象。如果方法600a没有找到任何语义对象,则方法600a继续处理剩余的搜索結果,步骤608。如果方法600a确定语义对象存在,则方法识别语义对象类,步骤610。在一个实施例中,识别语义对象类可包括检查对象定义以确定适当的对象类。在此实施例中,方法600a可查询将对象类型与所定义的类关联起来的类数据库或文件。例如,vCard对象可被指派到商务(Business)类。或者,语义对象可与多个类相关联。例如, vCard可被指派至Ij商务禾ロ个人(Business and Person)类。方法600a随后对搜索结果分类,步骤612。在一个实施例中,对搜索结果分类可包括将搜索结果与所识别的类关联起来。方法600a随后在所有数据都已被处理之后存储分类数据,步骤616。在一个实施例中,存储分类数据可包括在诸如数据库之类的长期存储设备中存储在步骤612中创建的关联。图6b呈现了图示根据本发明一个实施例的用于从多个搜索结果中提取语义对象识别信息并且向用户提供语义类别链接的方法的流程图。根据图6b所示的实施例,方法600b接收搜索查询,步骤618。在图示实施例中,如本领域中已知的,方法600b可经由HTTP 请求从利用搜索门户的最终用户接收搜索查询。方法600b随后检索与查询相关联的捜索結果,步骤620。捜索结果检索技术是本领域中公知的,为了简明起见不再重述。方法600b随后选择给定的捜索結果,步骤622,并且识别语义对象类别,步骤624。 在图示实施例中,识别语义对象类别可包括查询语义对象数据库以确定对于所选择的搜索结果是否存在匹配。如先前联系图6a所述,语义对象数据库可被预先填充以搜索结果和相关联的语义对象识别符的列表。例如,方法600b可选择由数值识别符“ 1234”识别的捜索結果。方法600b随后可查询语义对象数据库以寻找所有与识别符“1234”匹配的条目。如果找到匹配,则方法600b成功地识别出语义对象并且存储相关联的匹配。在分析检索到的捜索结果之后,方法600b选择语义对象类别以用于呈现,步骤 628。在一个实施例中,方法600b可选择预定数目的语义对象。例如,预定义的方案可指示方法600b只选择前三个出现的语义对象(例如在捜索结果内出现的前三个语义对象)。方法600b随后封装语义对象,步骤630。在一个实施例中,封装语义对象可包括生成可被置入在SRP内的独立对象。例如,方法600b可生成或识别与语义对象相关联的图像、与语义对象相关联的HTML活动数据链接以及与语义对象相关联的诸如Javakript之类的关联可执行代码。方法600b可組合这些和各种其他形式的数据以生成独立的语义对象。最后,方法600b呈现搜索结果和语义对象类别,步骤632。在一个实施例中,方法 600b将先前生成的语义对象代码嵌入在SRP或SRP模板内,如前所述。在一个实施例中,对象可以是结构化的或非结构化的对象。此外,对象过滤器支持基于单个web位置内容源对捜索结果进行过滤,其中该单个web位置可以是内容一般且用户动作* 定的 web 位置(content general and user-action specific web location)。 就这里使用的而言,内容一般且用户动作特定的web位置是提供一般性质的内容并且允许特定用户动作的web位置。例如,该web位置可以是音频/视频分发web位置(例如漏. youtube. com、www. hulu. com )、购物直(例如 www. amazon. com ΦΦ )、社父媒体 web 位置(例如www. facebook. com、www. linkedin. com等等)或者用户生成内容web位置(例如 en. wikipedia. com 等等)。图7呈现了图示根据本发明一个实施例的捜索结果页面的屏幕图。根据图7所示的实施例,可向用户呈现包括多个组件702、704、706和708的一般SRP 700。如图所示,该 SRP包括指示用户输入的查询的文本字段702和多个搜索结果704。除了搜索结果704以外,SRP 700还呈现边栏706,边栏706包括各种数据对象,其中包括经由活动数据链接708在输出显示中可见的多个枢轴数据点和经由活动数据链接 710在输出显示中可见的多个语义对象过滤器。枢轴数据点708和语义对象过滤器710可包括HTML、图像和Javakript组件,如前所述。另外,枢轴数据点708和语义对象过滤器 710可被用户选择,如将联系图8和9呈现的那样。图8呈现了图示根据本发明一个实施例响应于对枢轴数据点的选择而检索到的多个搜索结果的样本截屏图。根据图8所示的实施例,响应于对枢轴数据点802的选择,向用户呈现精炼的SRP 800。在用户选择枢轴数据点802 (标记为“Wikipedia” )之后,捜索结果窗格804被用
13仅来自域“http://en. wikipedia. org”的结果806更新。此外,经更新的SRP 800提供了描述性标题栏808,表明用户已转移到了精炼的搜索结果页面中。最后,经更新的SRP 800 标题栏808包括导航控件810,其允许用户返回到先前SRP 700。图9呈现了图示根据本发明一个实施例响应于对语义类别链接的选择而检索到的多个搜索结果的样本截屏图。根据图9所示的实施例,响应于对语义对象过滤器902的选择而向用户呈现精炼的SRP 900。在用户选择语义对象过滤器802(标记为“Video Sites”)之后,搜索结果窗格904 被用仅包含视频对象的结果906(例如^uTube页面)更新。在替换实施例中,连同其他对象可向用户呈现多个其他对象802。例如,个人或产品对象可被显示在语义对象过滤器802 旁边。此外,经更新的SRP 900提供了描述性标题栏908,表明用户已转移到了精炼的搜索结果页面中。最后,经更新的SRP 900标题栏908包括导航控件910,其允许用户返回到先前 SRP 700。图1至9是使得可以说明本发明的概念图示。应当理解,本发明的实施例的各种方面可用硬件、固件、软件或其組合来实现。在这种实施例中,各种组件和/或步骤将被用硬件、固件和/或软件实现来执行本发明的功能。即,同一个硬件、固件或软件模块可执行图示的块(例如组件或步骤)中的ー个或多个。在软件实现方式中,计算机软件(例如程序或其他指令)和/或数据被存储在作为计算机程序产品的一部分的机器可读介质上,并且经由可移除存储驱动器、硬驱动器或通信接ロ被加载到计算机系统或其他设备或机器中。计算机程序(也称为计算机控制逻辑或计算机可读程序代码)被存储在主存储器或次存储器中,并且被一个或多个处理器(控制器等等)执行以使得一个或多个处理器执行如这里所述的发明的功能。在本文献中,术语“机器可读介质”、“计算机程序介质”和“计算机可使用介质”用于概括地指诸如以下介质随机访问存储器(RAM);只读存储器(ROM);可移除存储单元(例如磁盘或光盘、闪存设备等等);硬盘;等等。要注意,以上的附图和示例并不欲将本发明的范围限制到单个实施例,因为通过替换所描述或图示的元素中的ー些或全部,可以实现其他实施例。另外,在本发明的某些元素可部分或全部利用已知组件实现的情况下,只描述了这种已知组件的对于理解本发明必要的那些部分,而省略了对这种已知组件的其他部分的详细描述以免模糊本发明。在本说明书中,示出单数组件的实施例不一定受限于包括多个同一组件的其他实施例,反之亦然, 除非这里另有明确声明。另外,申请人不希望说明书或权利要求中的任何术语被赋予非常见或特殊的含义,除非明确地如此提出。另外,本发明包含了这里作为例示述及的已知组件的当前和将来已知的等同。以上对具体实施例的描述因此充分掲示了本发明的一般性质,他人通过应用相关领域的技能范围内的知识(包括这里引用并通过引用并入的文献的内容)可以针对这种具体实施例的各种应用而容易地修改和/或适应性改变本发明的一般性质,无需过度的实验,而不脱离本发明的一般概念。因此,基于这里给出的教导和指引,这种适应性改变和修改想要在所公开的实施例的等同物的含义和范围内。要理解,这里的措词或用语是为了描述而非限制的,从而本说明书的用语或措辞应由本领域的技术人员根据这里给出的教导和指引、结合相关领域的技术人员的知识来解释。
虽然以上已经描述了本发明的各种实施例,但应当理解是以示例而非限制方式给出这些实施例的。相关领域的技术人员将会清楚对其可以作出形式和细节上的各种改变, 而不脱离本发明的精神和范围。从而,本发明不应受限于任何上述示例性实施例,而应当仅根据权利要求及其等同物来限定。
权利要求
1.一种用于生成捜索结果的方法,该方法包括 接收包括至少ー个捜索词语的搜索请求;基于所述搜索请求访问涉及web内容的数据的语料库以确定用于包括在结果集合中的相关内容;基于对搜索结果集合的审查而确定所述搜索结果集合中的至少ー个语义对象,所述语义对象是关联并包含在所述web内容内的有关数据; 基于所述至少ー个语义对象生成对象过滤器;生成用于呈现所述搜索结果集合的至少一部分和用于所述语义对象中的ー个或多个的活动数据链接的捜索结果输出显示;以及响应于对给定的活动数据链接的选择而切換所述搜索结果输出显示以呈现所述搜索结果集合的子集的至少一部分,所述搜索结果的子集包括具有与之相关联的语义对象的 web内容。
2.如权利要求1所述的方法,其中,所述语义对象可以是以下各项中的至少ー个结构化对象和非结构化对象。
3.如权利要求1所述的方法,其中,所述对象过滤器基于单个web位置内容源来过滤搜^ η ^iv ο
4.如权利要求3所述的方法,其中,所述单个web位置内容源是内容一般且用户动作特定的web位置。
5.如权利要求4所述的方法,其中,所述web位置是以下各项中的至少ー个音频/视频分发web位置、购物web位置、社交媒体web位置和用户生成内容web位置。
6.如权利要求1所述的方法,还包括在所述活动数据链接之一被选择时,显示退出切換显示以便回复到所述搜索结果集I=I O
7.一种用于生成捜索结果的系统,该系统包括 存储有可执行指令的计算机可读介质,以及处理设备,响应于所述可执行指令,可操作以 接收包括至少ー个捜索词语的搜索请求;基于所述搜索请求访问涉及web内容的数据的语料库以确定用于包括在结果集合中的相关内容;基于对搜索结果集合的审查而确定所述搜索结果集合中的至少ー个语义对象,所述语义对象是关联并包含在所述web内容内的有关数据; 基于所述至少ー个语义对象生成对象过滤器;生成用于呈现所述搜索结果集合的至少一部分和用于所述语义对象中的ー个或多个的活动数据链接的捜索结果输出显示;以及响应于对给定的活动数据链接的选择而切換所述搜索结果输出显示以呈现所述搜索结果集合的子集的至少一部分,所述搜索结果的子集包括具有与之相关联的语义对象的 web内容。
8.如权利要求7所述的系统,其中,所述语义对象可以是以下各项中的至少ー个结构化对象和非结构化对象。
9.如权利要求7所述的系统,其中,所述对象过滤器基于单个web位置内容源来过滤搜^ ^0 O
10.如权利要求9所述的系统,其中,所述单个web位置内容源是内容一般且用户动作特定的web位置。
11.如权利要求10所述的系统,其中,所述web位置是以下各项中的至少ー个音频/ 视频分发web位置、购物web位置、个人娱乐web位置和用户生成内容web位置。
12.如权利要求7所述的系统,所述处理设备响应于可执行指令还可操作以在所述活动数据链接之一被选择时,显示退出切換显示以便回复到所述搜索结果集I=I ο
13.—种包括程序代码的计算机可读介质,所述程序代码在被可编程处理器执行时使得执行ー种用于生成捜索结果的方法,所述计算机可读介质包括用于接收包括至少ー个捜索词语的搜索请求的程序代码;用于基于所述搜索请求访问涉及web内容的数据的语料库以确定用于包括在结果集合中的相关内容的程序代码;用于基于对搜索结果集合的审查而确定所述搜索结果集合中的至少ー个语义对象的程序代码,所述语义对象是关联并包含在所述web内容内的有关数据; 用于基于所述至少ー个语义对象生成对象过滤器的程序代码; 用于生成用于呈现所述搜索结果集合的至少一部分和用于所述语义对象中的ー个或多个的活动数据链接的捜索结果输出显示的程序代码;以及用于响应于对给定的活动数据链接的选择而切換所述搜索结果输出显示以呈现所述捜索结果集合的子集的至少一部分的程序代码,所述搜索结果的子集包括具有与之相关联的语义对象的web内容。
14.如权利要求13所述的计算机可读介质,其中,所述语义对象可以是以下各项中的至少ー个结构化对象和非结构化对象。
15.如权利要求13所述的计算机可读介质,其中,所述对象过滤器基于单个web位置内容源来过滤搜索結果。
16.如权利要求15所述的计算机可读介质,其中,所述单个web位置内容源是内容一般且用户动作特定的web位置。
17.如权利要求16所述的计算机可读介质,其中,所述web位置是以下各项中的至少ー 个音频/视频分发web位置、购物web位置、社交媒体web位置和用户生成内容web位置。
18.如权利要求13所述的计算机可读介质,还包括用于在所述活动数据链接之一被选择时显示退出切換显示以便回复到所述搜索结果集合的程序代码。
全文摘要
本发明提供了用于生成搜索结果的方法和系统,包括接收搜索请求并且访问涉及web内容的数据的语料库以确定相关内容。该方法和系统包括确定搜索结果集合中的至少一个语义对象并且基于至少一个语义对象生成对象过滤器。该方法和系统还包括生成用于呈现搜索结果集合的至少一部分和用于语义对象中的一个或多个的活动数据链接的搜索结果输出显示,并且响应于对给定的活动数据链接的选择而切换搜索结果输出显示以呈现搜索结果集合的子集的至少一部分,该子集包括具有与之相关联的语义对象的web内容。
文档编号G06F17/30GK102549573SQ201080042083
公开日2012年7月4日 申请日期2010年9月17日 优先权日2009年9月20日
发明者克里斯多佛·鲁沃格特, 凯文·哈斯, 林依安 申请人:雅虎公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1