转换搜索引擎查询的制作方法与工艺

文档序号:12008769阅读:256来源:国知局
转换搜索引擎查询的制作方法与工艺
本申请涉及计算机网络系统中的数据处理和信息检索领域,具体的,涉及提高搜索引擎生成的搜索结果的相关性。相关申请本申请涉及以下美国临时专利申请:2009年6月19日申请的61/218,889、2010年10月30日申请的61/408,606、2010年12月6日申请的61/420,267和2011年5月19日申请的61/488,112;以及2010年6月21日申请的PCT申请PCT/US10/39395,通过引用的方式将以上申请所公开的内容合并于此。

背景技术:
搜索引擎提供了定位文件中的内容以及定位来自大型信息数据库的其他信息源中的内容的强大的工具,例如,大型信息数据库为对因特网或者万维网(WWW)进行访问的信息,和/或存储在内联网的计算机上的文件。响应于搜索查询,可对信息进行检索,搜索查询由用户提交的一个或者多个单词、术语、关键词和/或短语组成。搜索引擎的目的是:基于搜索查询,为用户提供高质量的相关结果(例如,网页)的链接。通常,搜索引擎通过将搜索查询中的术语与从数据库检索到的文件以及其他信息源进行匹配,来实现该目的。随着搜索查询方法的发展,越来越多的搜索结果中包含了可能会影响搜索结果的质量的杂乱的信息。搜索引擎的有效性取决于返回的搜索结果的相关性。在搜索查询中会考虑到数百万的网页,一些网页可能比其他网页更相关、更流行或者更有权威。此外,搜索结果已受到越来越多的操纵,以使其包括不期望的信息,这样搜索结果容纳有与广告、营销相关的利益或者围绕实际查询的其他利益。因此,网页正受到采用了诸如垃圾索引(spamdexing)、链接工厂(linkfarming)、关键词堆砌(keywordstuffing)和文章伪原创(articlespinning)的技术的网站的越来越多的坏影响,这些技术不仅降低了搜索结果的相关性,还降低了用户体验的质量。现有的搜索引擎方法缺乏生成克服这种危害并且折衷搜索引擎性能的搜索结果的灵活性。附图说明为了更好地理解本申请所描述的主题,应结合下面的附图来参考以下的说明,其中,在整个附图中,相同的附图标记表示相应的部件。图1是根据实施方式的网络系统的框图。图2是根据一些实施方式的处理搜索查询以生成替换的结果的流程图。图3是根据一些实施方式的当图1的搜索引擎系统已经生成替换的搜索时,示出的搜索结果显示的框图。图4是根据实施方式的示出服务器系统的实施方式的框图。图5示出了根据一些实施方式的客户端系统的实施方式的框图。图6是根据一些实施方式的用户正在搜索框中输入搜索请求的屏幕快照。图7是根据一些实施方式的搜索结果列表的屏幕快照。图8是根据一些实施方式的用于浏览与斜杠标签有关的网站/URL列表的网页浏览器的例子的屏幕快照。图9是根据一些实施方式的用于自定义各种斜杠标签搜索功能的偏好用户界面的图示的屏幕快照。图10A-E是根据一些实施方式的用于自定义斜杠标签搜索的其他功能的用户界面的各种例子的屏幕快照。图11是根据一些实施方式的搜索结果列表的图示的屏幕快照,搜索结果列表包括认定的搜索引擎垃圾或者用户可能认作搜索引擎垃圾的项。图12是根据一些实施方式的登陆到搜索引擎系统中的用户账户的登陆界面的图示的屏幕快照。图13是许可界面的屏幕快照,用于设置许可偏好,从而0访问外部社交网络的网站。图14是根据实施方式的一旦用户已经通过社交网络网站登录就提供给用户的搜索界面的屏幕快照。图15是根据一些实施方式的与/喜欢斜杠标签相关的统一资源定位符列表的屏幕快照。图16是根据一些实施方式的当通过社交网络网站登录到搜索引擎时执行搜索查询的屏幕快照。图17是根据一些实施方式的当通过社交网络网站登录到搜索引擎时生成的另一个搜索结果的屏幕快照。图18是根据一些实施方式的当/喜欢斜杠标签包括在搜索查询中时,图17的搜索结果可被如何修改的屏幕快照。图19是根据一些实施方式的搜索界面的其他功能的例子的屏幕快照。图20是根据一些实施方式的搜索界面的另一个功能的例子的屏幕快照。图21示出了根据一些实施方式的显示如何使用提升的斜杠标签生成搜索结果的屏幕快照表示。图22是根据一些实施方式的示出使用/登记斜杠标签生成搜索结果的框图。图23是根据一些实施方式的示出使用基于本地的斜杠标签生成的搜索结果的例子的框图。图24是根据一些实施方式的示出查询协调系统的框图。具体实施方式下面将参考详细的实施方式,其中的例子在附图中示出。在接下来的描述中,阐述了许多具体的细节,以充分理解在此所提出的主题。但是,无需这些具体的细节也可实施该主题,这对本领域技术人员来说是显而易见的。此外,在此所描述的特定实施方式是以举例的方式提供的,并且这些特定的实施方式不应该用于将本发明的范围限制到这些特定的实施方式。在其他情况下,没有详细地描述公知的数据结构、时间协议、软件操作、程序和组件,以避免不必要的使本发明的实施方式的特征不清楚。本公开文本涉及一种用于处理将要在web浏览器中显示的内容的方法。所述方法包括:检测搜索查询中的至少一个关键词;基于至少一个关键词,自动生成替换的搜索查询,替换的搜索查询包括与至少一个关键词相关的搜索算子;基于替换的搜索查询,生成第一搜索结果;以及在web浏览器中显示第一搜索结果。在所述方法中,搜索算子是斜杠标签。所述方法进一步包括:提供选择第二搜索结果的链接,第二搜索结果基于搜索查询中的至少一个关键词。所述方法还包括:检测至第二搜索结果的链接的选择;基于搜索查询中的至少一个关键词生成第二搜索结果;以及在web浏览器中显示第二搜索结果。此外,在所述方法中,在同一个web浏览器中并排显示第一搜索结果和第二搜索结果。进一步的,在所述方法中,第一搜索结果和第二搜索结果的每个结果项均包括两行的格式,其中,第一行用于超链接到相应的网页URL的网页URL的标题;以及第二行用于由网站标题、一个或者多个内容标签、一个或者多个站点标签和可选的摘录组成的组的至少一个子集。在所述方法中,一个或者多个站点标签包括在web浏览器上显示的组的至少一个子集,该组由链接、搜索引擎优化(seo)、rss(rss)、缓存、资源、ip、排名、主机排名和相关广告组成。此外,在所述方法中,一个或者多个站点标签包括社交网络指示符,以使用户能够表示对相应的搜索项的偏好。进一步的,在所述方法中,社交网络指示符是“喜欢”链接和“签到”链接。在所述方法中,斜杠标签是“/喜欢”斜杠标签和“/签到”斜杠标签。此外,在所述方法中,基于添加或者删除搜索查询中的关键词的一个或者多个智能标准生成替换的搜索查询。进一步的,在所述方法中,智能标准包括组中的至少一个信息,该组由以下信息组成:与第一搜索结果的一个或者多个搜索词相关的顺序和排名信息、文件的有效期、点击或者使用文件的频率、提出搜索请求的用户的用户概况、提出搜索请求的用户的用户历史以及地理位置。在所述方法中,智能标准基于启发式方法。本公开文本还涉及一种用于处理将要在web浏览器中显示的内容的方法。所述方法包括:检测搜索查询中的至少一个关键词;从至少一个关键词生成替换的搜索查询,替换的搜索查询至少基于当用户正键入多个字符时,计算至少一个关键词的多个字符的中间搜索;基于替换的搜索查询,生成第一搜索结果;在web浏览器中显示第一搜索结果。在所述方法中,可选的搜索查询包括斜杠标签。此外,在所述方法中,通过压缩中间搜索结果的内容来计算中间搜索,其中压缩包括缩写及省略中间搜索结果中的每个输入的一部分。进一步的,在所述方法中,通过忽略URL路径信息,计算得到中间搜索结果的压缩的内容。在所述方法中,从以前查询的搜索结果的数据库计算中间搜索。此外,在所述方法中,通过在用户正键入多个字符时使用自动提示猜测至少一个关键词,来计算中间搜索。进一步的,在所述方法中,当用户键入至少一个关键词中的多个字符时,同时计算中间搜索。在所述方法中,通过使用锚文本来替换中间搜索结果中的内容的一个或者多个术语,而计算中间搜索。该方法进一步包括:提供选择第二搜索结果的链接,第二搜索结果基于搜索查询中的至少一个关键词。该方法还包括:检测对第二搜索结果的链接的选择;基于搜索查询中的至少一个关键词生成第二搜索结果;以及在web浏览器中显示第二搜索结果。此外,在所述方法中,在同一个web浏览器中并排显示第一搜索结果和第二搜索结果。本公开文本进一步涉及一种用于处理将要在web浏览器中显示的内容的方法。所述方法包括:检测搜索查询中的至少一个关键词;基于至少一个关键词,生成替换的搜索查询,替换的搜索查询包括与至少一个关键词相关的搜索算子;基于替换的搜索查询,生成第一搜索结果;以及在web浏览器中显示第一搜索结果。本公开文本涉及一种用于处理将要在web浏览器中显示的内容的方法。方法包括:检测搜索查询中的至少一个搜索算子,该搜索算子与社交网络网站的内容分类相关;以及响应于对搜索查询的检测,至少基于与搜索算子相关的内容分类生成第一搜索结果,并在web浏览器中显示第一搜索结果。在所述方法中,基于至少包括与搜索算子相关的内容分类的标准对多个搜索结果项进行排名。此外,在所述方法中,内容分类是从与社交网络网站相关的多个用户收集到的轮询数据。进一步的,在所述方法中,搜索算子是“/喜欢”斜杠标签和“/签到”斜杠标签。本公开文本还涉及一种用于处理将要在web浏览器中显示的内容的方法。方法包括:检测搜索查询中的至少一个搜索算子;检测与至少一个搜索算子相关的提升指示符;响应于检测的提升指示符生成第一搜索结果,第一搜索结果包括搜索结果中的多个搜索项的至少一个子集的提升的排名;以及在web浏览器中显示第一搜索结果。此外,在所述方法中,多个搜索结果项的子集在生成的搜索结果中具有较高的排名。进一步的,在所述方法中,搜索结果项的每个子集均与提升标准相关。在所述方法中,提升标准包括与在社区内收集到的意见或者评论相关的标准。此外,在所述方法中,社区是用于分享内容并对分享的内容进行评论的平台。进一步的,在所述方法中,社区是用于基于专家意见确定分享的内容的平台。在所述方法中,通过提升公式确定提升的排名。此外,在所述方法中,提升公式强调了多个搜索结果项的子集的相关性。进一步的,在所述方法中,提升标准包括由站点的流行度、站点或者文件的点击频率、包括在搜索查询中的频率、站点或者文件是否被快速存储组成的组中的至少一项。在所述方法中,提升标准包括与一个或者多个社交网络网站的轮询数据相关的标准。此外,在所述方法中,搜索结果中的多个搜索结果项的至少一个子集的提升的排名包括与子集中的每个搜索结果项相关的权重系数。方法还包括:生成第二搜索结果,其中,没有使用提升标准来生成第二搜索结果;以及提供选择第二搜索结果的链接。进一步的,在所述方法中,在同一个web浏览器中并排显示第一搜索结果和第二搜索结果。在所述方法中,第一搜索结果和第二搜索结果的每个结果项均包括两行的格式,其中第一行用于超链接到相应的网页URL的网页URL的标题;以及第二行用于由网站标题、一个或者多个内容标签、一个或者多个站点标签和可选的摘录组成的组的至少一个子集。此外,在所述方法中,一个或者多个站点标签包括:在web浏览器上显示的由链接、seo、rss、缓存、资源、ip、排名、主机排名和相关广告组成的组的至少一个子集。进一步的,在所述方法中,一个或者多个站点标签包括社交网络指示符,以使用户能够表示对相应的搜索项的偏好。在所述方法中,搜索查询进一步包括至少一个其他斜杠标签。此外,在所述方法中,与至少一个搜索算子相关的提升指示符包括:作为搜索算子的/历史斜杠标签,其中,与/历史斜杠标签相关的提升指示符使得用户在过去浏览过的一个或者多个网站的排名得到提升。所述方法还包括使用加密密钥来存储与用户的浏览历史相关的内容,并且被配置为通过用户的动作来解密。所述方法还包括,被配置为通过用户的动作来解密历史数据包括:每次使用/历史斜杠标签时,对加密的内容进行解密。所述方法包括,被配置为通过用户的动作来解密历史数据,并且动作包括每次用户登录时,对加密的内容进行解密。本公开文本涉及一种搜索引擎系统。搜索引擎系统包括:负载均衡器,被配置为分布并分配搜索引擎系统中的工作负荷;斜杠标签服务器,被配置为基于从用户接收到的搜索查询中的至少一个关键词生成替换的搜索查询,替换的搜索查询包括与至少一个关键词相关的斜杠标签;以及web服务器,被配置为从至少一个数据库集群的一个或者多个节点检索内容,并基于替换的搜索查询生成第一搜索结果,web服务器被进一步的配置为在web浏览器中显示第一搜索结果本公开文本还涉及一种搜索引擎系统。搜索引擎系统包括:斜杠标签服务器,被配置为检测搜索查询中的至少一个关键词,并从至少一个关键词生成替换的搜索查询,替换的搜索查询至少基于当用户正键入多个字符时计算至少一个关键词中的多个字符的中间搜索;以及web服务器,被配置为基于替换的搜索查询生成第一搜索结果,并在web浏览器中显示第一搜索结果。本公开文本还涉及一种搜索引擎系统。搜索引擎系统包括:斜杠标签服务器,被配置为检测搜索查询中的至少一个关键词,并基于至少一个关键词生成替换的搜索查询,替换的搜索查询包括与至少一个关键词相关的搜索算子;以及web服务器,被配置为基于替换的搜索查询生成第一搜索结果,并在web浏览器中显示第一搜索结果。此外,本公开涉及一种搜索引擎系统。搜索引擎系统包括:斜杠标签服务器,被配置为检测搜索查询中的至少一个搜索算子,搜索算子与社交网络网站的内容类别相关;以及web服务器,被配置为响应于对搜索查询的检测,至少基于与搜索算子相关的内容分类生成第一搜索结果,并在web浏览器中显示第一搜索结果。此外,本公开涉及一种搜索引擎系统。搜索引擎系统包括:斜杠标签服务器,被配置为检测搜索查询中的至少一个搜索算子,并检测与至少一个搜索算子相关的提升指示符;以及web服务器,被配置为响应于检测到的提升指示符生成第一搜索结果,第一搜索结果包括搜索结果中的多个搜索项的至少一个子集的提升的排名,并在web浏览器中显示第一搜索结果。搜索引擎系统进一步包括第一存储器和第二存储器,每个存储器均被配置为与web服务器交互,其中,第一存储器被配置为存储搜索引擎索引数据,并且其中第二存储器被配置为存储被确定为更重要的搜索引擎索引数据的子集。在搜索引擎系统中,第二存储器包括固态硬盘。图1是根据实施方式的网络系统100的框图。系统100包括一个或者多个客户端装置110A、110B,客户端装置110A、110B连接到通信网络130以与搜索引擎系统102进行通信。搜索引擎系统102对用户在客户端装置110作出的查询进行应答。用户可提交由单词、术语、关键词和/或短语中的一个或者多个组成的搜索查询。用户可以选择性地指定搜索算子,搜索算子用于在仅使用关键词所获得的结果之外,对结果进行专业化和细化。搜索引擎服务器将搜索查询与数据库的信息进行匹配,并检索与查询相关的信息。通过使用结果的网址、内容标签、网站标签以及可选的文本片段中的一个或者多个,来显示结果,从而提供了文件或者其他信息源的链接。搜索算子包括在特定的语法中,下面将对其作更具体的描述。客户端装置110可以是众多装置(例如,计算机、上网亭(internetkiosk)、个人数字助理、移动电话装置、游戏装置、台式计算机、平板电脑或者笔记本电脑)中的任意一个。客户端装置110可包括客户端应用132、客户端辅助134和/或客户端存储器136。客户端应用132可以是允许用户与客户端装置110交互和/或经由客户端装置110与网络资源交互以执行一个或者多个任务的软件应用程序。例如,客户端应用132可以是网页浏览器(例如,为了访问搜索引擎)或者是允许用户作出搜索请求(例如,提交搜索查询)、在线浏览内容和/或访问位于搜索引擎系统102中的其他资源(例如,网页和web服务)的其他类型的应用。客户端装置110可经由通信网络130访问在这些节点的资源。客户端辅助134可以是执行一个或者多个任务的软件应用程序,任务涉及监控或者辅助与客户端应用132和/或其他应用相关的用户的活动。例如,客户端辅助134辅助用户在客户端110浏览由网站提供的资源(例如,文件);处理搜索引擎系统102生成的信息项(例如,搜索结果);和/或监控用户对搜索结果处理的活动。在一些实施方式中,客户端辅助134是客户端应用132的一部分,其可作为客户端应用132的插件或者扩展(例如,由各种在线资源提供),而在其他实施方式中,客户端辅助134是与客户端应用132分离的、独立的程序。在一些实施方式中,客户端辅助134被嵌入到一个或者多个网页中,或者被嵌入到从一个或者多个服务器(例如,服务器集群116)下载的其他文件中。客户端存储器136能够存储信息,例如:网页、从搜索引擎系统102接收到的搜索结果、系统信息和/或有关用户的信息。在其他实施方式中,客户端应用132可为移动装置上的移动应用,移动应用使用户能够访问在用户的移动装置上看到的网页浏览器上的网页。搜索引擎系统102处理在客户端110提交的搜索查询,根据搜索查询生成搜索结果,并将结果返回到客户端110。搜索引擎系统102可包括一个或者服务器或者服务器集群(例如,116),这些服务器存储、管理并检索从不同的网站或者内容位置获得的大量的索引文件。搜索引擎系统102包括负载均衡器103,其用于分配搜索引擎系统102中的工作负荷,以获得最优的资源利用率、最大化吞吐量、最小化响应时间并避免过载。搜索引擎102进一步包括web服务器106和用于响应用户在客户端110提交的查询请求的查询守护进程(querydaemon)108。web服务器106和查询守护进程108从一个或者多个存储并维护数据的集群116中的一个或者多个节点检索内容。搜索引擎系统102还包括自动斜杠标签(auto-slashtag)服务器112,其用于当接收到搜索查询时生成替换的搜索结果。顾名思义,替换的搜索结果可通过使用算法以自动的方式来生成。在一些实施方式中,基于手动的选择/输入生成搜索结果,而在其他实施方式中,可通过手动和自动特征的组合来生成结果。在后面的部分中,将对这些功能作进一步的描述。替换的搜索结果可以是搜索算子,或者可包括搜索算子,例如,斜杠标签(slashtag),搜索算子包括在特定的语法中,特定的语法可由先前描述的数据库结构识别,或者由被配置为使用该搜索算子的其他数据库系统识别。斜杠标签可以是算子,其中,用户在任意查询中附加字符“/”,随后是选择的算子。在一些实施方式中,斜杠标签确定搜索范围,搜索范围可以通过自动的方式指定,也可以通过手动的方式指定。在一些实施方式中,选择的算子可以是关键词。自动斜杠标签服务器112还可查询特定索引114,特定索引114允许预搜索以生成替换的搜索结果,下面将对其进行详细描述。特定索引114允许自动斜杠标签服务器112快速存储并检索数据,以生成替换的搜索结果。应当理解,可在不同的装置和/或不同的地点执行搜索引擎系统102的任何部分。例如,可以全部或者部分的将负载均衡器103、web服务器106、查询守护进程108以及自动斜杠标签服务器112的一个或者多个操作进行组合,以在同一个装置、不同的装置或者多于一个装置的组合上执行上述操作。通信网络130可以是任何有线或者无线局域网(LAN)、城域网和/或广域网(WAN),例如,内联网、外联网或者互联网,或者通信网络130可以是这些网络的组合。通信网络130能够在搜索引擎系统102内(例如,在集群和/或服务器的节点与数据存储单元之间)、以及搜索引擎系统102和客户端装置110之间提供通信能力。通信网络130可使用任何网络协议。例如,通信网络130可使用超文本传输协议(HTTP)来传输使用了传输控制协议/因特网协议(TCP/IP)的信息。HTTP允许客户端用户经由通信网络130访问各种可用的文件。然而,本发明的各个实施方式并不限制使用任何特定的协议。本说明书中通篇使用的术语“文件”是指由搜索处理引擎识别、存储、检索或者定位的任何一条信息或者业务,并且文件可例如是网页、特定格式的文档、数据库记录、视频、音频内容、图像、计算对象或者其他信息项。图2是根据一些实施方式的处理搜索查询以产生替换的结果的流程图。自动斜杠标签服务器112使用一个或者多个不同的智能标准来将用户提供的查询请求生成为替换的请求,所述智能标准根据查询请求的主题、上下文以及结果与查询相匹配的质量增加或者删除关键词。也可考虑其他标准,例如,搜索结果的顺序和排名、一个或者多个文件的有效期、点击或者使用的频率、用户概况、用户的历史、地理位置等。在一些实施方式中,智能标准可基于启发式方法,启发式方法允许替换的查询的确定在模式、历史、用户活动等基础上发展。在其他实施方式中,可考虑手动生成的转换列表,下面将对其进行进一步的描述。许多用户会通过在搜索框或者可输入文本的区域中键入一些关键词来进行检索,而不会考虑搜索引擎的特征是什么,例如,使用可能会改进他们的搜索的斜杠标签(或者其他搜索算子)。为了帮助这些用户获得更好的搜索结果,使用算法来生成包含不同的关键词和/或斜杠标签的替换的搜索结果,但是该搜索结果涉及到初始的搜索查询。这种算法可作为图1中的自动斜杠标签服务器112而被执行。作为例子,考虑关键词[宫保鸡丁]。搜索引擎系统102可能已经包括斜杠标签“/食谱”,其包括精选的高质量的食谱网站。用户可能不使用“/食谱”,但是自动斜杠标签服务器112可确定收集到的与“/食谱”有关的网站可能与查询相关,并且会将[宫保鸡丁]的许多搜索结果标记为食谱网站。在一些实施方式中,基于自动斜杠标签服务器112使用的标准确定诸如初始项[宫保鸡丁]的预搜索的结果。随后,通过基于自动斜杠标签生成的搜索查询执行替换的搜索,生成[宫保鸡丁/食谱]的替换的搜索结果,并将该替换的搜索结果呈现给用户。可以通过多种方式将该替换的搜索结果呈现给用户,例如,替换初始搜索或者将要进行的搜索、与初始搜索平行的显示、作为替换的结果列表的可选链接等。自动斜杠标签服务器112可基于关键词的不同组合和/或斜杠标签算子,生成多于一个的替换的搜索查询或者不同类型的替换搜索,它们中的每一个均可产生多于一个的搜索结果列表,用户可选择浏览该多于一个的搜索结果列表。例如,可通过增加或者删除关键词来改变初始的用户搜索查询。例子:[某关键词]→[某关键词/音乐]或者通过增加斜杠标签,以及还可能通过增加删除搜索关键词:例子:[豆腐食谱]→[豆腐/食谱][宫保鸡丁]→[宫保鸡丁/食谱]。在一些实施方式中,通过使用手动生成的转换列表,可生成替换的搜索。手动生成的转换列表可以是提供手动生成的指令或者设定一组斜杠标签或者斜杠标签列表的指令的一个或者多个规则,可基于用户的偏好、兴趣或者任何用户惯用的方式来构建该斜杠标签。示例性的规则是:“如果查询包含关键词“食谱(recipe)”或者“多个食谱(recipes)”,则将其删除并增加斜杠标签/食谱”。这可改进对食谱的搜索,但是可能会产生对搜索[后患无穷(recipefordisaster)]的较差的替换。更好的规则是:“如果最后的关键词是“食谱”或者“多个食谱”,才将其删除并增加斜杠标签/食谱”,这是因为大多数用户会在查询中的其他食物关键词后面键入“食谱”(例如,宫保鸡丁食谱)。确定如何生成替换的搜索的其他方法可包括对搜索关键词进行语法分析。如果搜索关键词看起来像是人名[BobTruel],自动斜杠标签服务器112就会选择“/人”作为候选斜杠标签。如果关键词看起来像街道地址,“/地图”可被选择为候选斜杠标签。再次参考图2,在一些实施方式中,可利用下面的计算机算法来生成替换的搜索。在步骤210接收到查询请求之后,在步骤220,算法准备确定是否生成替换的搜索。如果查询是单个关键词或者看起来像人名,那么决定可能是不选择生成任何的替换。在步骤230,执行对关键词的预搜索。预搜索使用关键词或者用户正键入的术语的特征,以执行有助于确定替换的搜索查询的中间搜索。有多种不同的执行预搜索的方法。一种实现预搜索的方式是:以在搜索引擎上进行搜索的普通搜索方式执行预搜索,例如,如果没有使用斜杠标签,则生成一般的搜索引擎结果。尽管预搜索可能是普通的搜索,但是这种功能也允许使用(例如:通过采用普通的倒排列表进行的)简化的快速搜索的一个或者多个组合特征,并且这种特征除了给定网站的特定条目外丢弃所有URL路径,以通过忽略所有URL路径来压缩倒排列表;以及利用以前的查询结果的数据库来进行快速搜索。预搜索可与一系统相结合,在该系统中,当用户键入的搜索查询关键词时,键盘字符被发送到服务器。该系统可以是本地系统,也可也是位于搜索引擎系统102之外的系统,例如,由第三方提供的系统。随后对用户键入的每个字符进行预搜索,其中可能使用自动建议(autosuggest)来猜测完整的关键词可能是什么。这些逐字符进行预搜索的好处是:当用户完成输入搜索关键词并按下回车键或者“搜索”按钮时,能更快的得到预搜索的结果。换句话说,预搜索与用户键入一个或者多个关键词的操作同时进行,这样,在用户已经完成输入一个或者多个关键词的时刻,预搜索也将会完成。然而,应当意识到的是,即使在用户已经完成输入搜索请求或者关键词的情况下,即,用户在紧接着键入搜索请求之后,点击“搜索”或者回车键,仍然可以实现更快的预搜索功能。另外一个执行预搜索的可选方案是使用占用较少的资源并可更快的返回搜索结果的预搜索方法,其速度可达数十毫秒,而非数百毫秒。这种速度特征允许执行快速预搜索,该快速预搜索可与用户键入搜索查询字符同时的、实时进行。能够以多种方式来执行这种简化的预搜索(ATS),这些方式包括以下方式中的一种:ATS1:去除全部网页的索引。在一些实施方式中,可以以简化的或者简略的方式提供预搜索的结果,例如,预搜索的结果可以是搜索到的网站的列表,而不是完整的搜索到的统一资源定位符(URL)。这使得有机会使用比一般索引小得多的索引来计算预搜索结果。能够通过去除完整的搜索引擎索引,来计算该较小的索引。该索引由每个搜索关键词的倒排列表组成。这些倒排列表包括URL列表,并对给定的关键词进行排名。由于自动斜杠标签服务器112只关注与每个关键词有关的网站,因此为了减少预搜索操作,可忽略或者不考虑URL路径信息。那么倒排列表中的同一个网站的所有条目可被合并。以这种方式,可快速地执行预搜索。例子:之前:关键词“林达尔(Lindahl)”的倒排列表:ur1=www.pbm.com/~lindahl/home.html,rank=1000ur1=www.pbm.com/~lindahl/about_me.html,rank=900url=en.wikipedia.com/wiki/Greg_Lindahl,rank=40之后:关键词“林达尔(Lindahl)”的简化倒排列表:host=www.pbm.com,rank=1900(两个条目合并为一个条目)host=en.wikipedia.com,rank=40简化的倒排列表非常小,使用ATS1进行搜索将比传统的搜索更快。ATS2:使用以前的查询结果的数据库ATS的第二种方法包括完全不使用普通的搜索索引,而是从以前的搜索结果中生成新的索引。这包括使用先前结果的大型数据库,该大型数据库将查询关键词与一定总量(例如,20)的URL的列表相匹配。然后生成这些关键词的倒排列表,倒排列表使这些URL的内容看起来好像是查询关键词。例如,假设只有2个搜索,每个搜索有2个URL结果:[狗粮]=>en.wikipedia.org/wiki/Dog_Food,www.pbm.com/dog/food.html[猫粮]=>en.wikipedia.org/wiki/Cat_Food,www.pbm.com/cat/food.html倒排列表将会是:[关键词猫]url=en.wikipedia.org/wiki/Cat_Food,rank=1url=www.pbm.com/cat/food.html,rank=1[关键词狗]url=en.wikipedia.org/wiki/Dog_Food,rank=1url=www.pbm.com/dog/food.html,rank=1[关键词食物]url=en.wikipedia.org/wiki/Cat_Food,rank=1url=www.pbm.com/cat/food.html,rank=1url=en.wikipedia.org/wiki/Dog_Food,rank=1url=www.pbm.com/dog/food.html,rank=1在此可使用与ATS1同样的技术,即,只保留主机名并且丢弃URL路径信息。因此:[关键词猫]url=en.wikipedia.org,rank=1url=www.pbm.com,rank=1[关键词狗]url=en.wikipedia.org,rank=1url=www.pbm.com,rank=1[关键词食物]url=en.wikipedia.org,rank=2url=www.pbm.com,rank=2该索引很可能非常小并且非常快。如果任何的这些替换的索引在单节点上写入到RAM或者闪存盘,就会节省大量的时间并且会减少资源的利用。ATS3:交替使用以前的查询结果(增加附加的单词,例如,锚文本)另外一种方法将ATS2扩展到使用附加的关键词,例如,索引中的每个URL的锚文本。为了便于说明,假设URLwww.pbm.com/dog/food.html具有锚文本,其包括单词“狗”、“食物”、“零食”、“点击”和“这里”。首先,对锚文本的关键词进行筛选,以丢弃像“点击”和“这里”这样没有用的单词。然后,添加附加的条目或者增加倒排列表中已存在的条目(如“狗”、“食物”和“零食”)的等级。得到的索引比ATS2的索引大,但是能够具有显著的更好的结果。现在返回到图2,在步骤240,可基于预搜索的结果选择候选斜杠标签。给定预搜索的结果,可选择候选斜杠标签以将其加入到替换的搜索。一种方法是查看前N个最好的结果。如果这些结果大多数落入单个斜杠标签,那个斜杠标签就会被选作候选。可选的,通过人的交互或者通过一些语义分析而确定的算法,一些网站或者URL可与标签相关。作为例子,可考虑手工生成食谱网站列表,或者可考虑使用提前写好的计算机算法来猜测给出的网页是否是食谱。在手工和算法这两种情况下,用于选择候选斜杠标签的最有用的网站可能会对查询给出糟糕的应答,给出的可能是已经针对这个主题被高度的搜索引擎优化(SEO,search-engineoptimized)过的网页。例如,对于有关健康的查询,“/健康”斜杠标签可能包括高质量的、以消费者为导向的健康网站,例如,梅奥诊所的网站。梅奥的网站没有被高度的搜索引擎优化,在有关健康查询的结果中的排名可能不会太高。但是在搜索结果中会有很多不好的网站(搜索引擎垃圾或者相关广告区),例如,针对查询关键词[mesothelioma]被高度的搜索引擎优化的网站mesothelioma.com。既可通过手工,也可通过使用语义算法,将mesothelioma.com标记为健康网站。然后当预搜索的前N个结果中出现mesothelioma.com时,这表明预搜索中的查询关键词与健康有关。健康标签也可与“/健康”斜杠标签相关。已经选择了一个或者多个候选斜杠标签后,在步骤250,可通过如下的丢弃一个或者多个候选标签对列表进行筛选。如果在列表中有不同的斜杠标签,例如,“/歌词”和“/健康”,可确定查询难以理解,并将“/歌词”和“/健康”都取消作为候选。如果在列表中有相似的斜杠标签,例如,“/心理学”和“/健康”,则可能会将这两个标签都保留为候选。对每个保留的斜杠标签候选来说,生成替换的搜索,有可能从搜索中增加或者删除一些关键词。例如,对于搜索[豆腐食谱]来说,会生成单个候选斜杠标签“/食谱”。在步骤260,如果适用,可去除一个或者多个关键词。例如,去除与单词“食谱”同义的关键词,保留替换的搜索为[豆腐/食谱],而不是[豆腐食谱/食谱]。如果有多个斜杠标签候选,每个候选搜索可能会有不同的关键词,为了冗余等原因,可能会对每个候选搜索进行修改,以使替换的搜索有更好的形式。因此,在步骤270,系统确定是否显示替换的斜杠标签和/或结果列表。图3是根据一些实施方式的当图1的搜索引擎系统102已经生成替换的搜索时的搜索结果显示的框图。如果有一个或者多个保留的替换的搜索,则向用户呈现一个或者多个结果。这包括一个或者多个实际的搜索结果集合,和/或链接到其他替换的搜索的可点击的链接。在第一可选的显示320中,可向用户呈现最优的搜索结果A322,但是可以给出一系列的选项。可向用户提出问题“您是指“搜索B”(Didyoumeans“SearchB”)?”,为用户提供替换的搜索结果。还可以在问题“您想返回到初始搜索吗?(Didyouwantyouroriginalsearch?)”中,给用户一个选择,使用户可以选择返回到初始搜索结果的链接。如果呈现给用户的搜索结果不包括初始搜索,可以点击可点击的链接,该可点击的链接在不对关键词做任何改变并且不增加斜杠标签的情况下,执行初始搜索。图1中的自动斜杠标签服务器112基于其确定替换的搜索将吸引用户的信心的程度,选择向用户显示的结果。例如,如果候选斜杠标签仅得到预搜索的微弱支持,那么可能就不会选择该斜杠标签,并且相应的替换的搜索可能就不是唯一显示的结果。在具有多于一个替换的搜索结果的情况下,可以按重要性的排序来显示结果,或者显示最好的结果的子集。在另一个可选的显示324中,可向用户呈现两个最好的搜索结果:搜索结果A326和搜索结果B328,这两个搜索结果彼此相邻,并按并排的方式显示。可选的,搜索结果326、328中的一个可能是初始搜索结果,另外一个是最好的结果。显示324可包括指向另外的搜索结果的链接,如通过问题“您是指“搜索C”?(Didyoumeans“SearchC”)”来指示。如果搜索结果A326和搜索结果B328都不是初始结果,那么可向用户提示问题“您是指初始搜索?”,以提供指向初始搜索的单独的链接。在一些实施方式中,可对替换的搜索执行附加的修改。例如,如果用户指定“/食谱”,然后该用户可发现只看到高质量的食谱网站的结果是可以接受的。如果自动斜杠标签服务器112已经将[宫保鸡丁]转换成替换的[宫保鸡丁/食谱],那么通过增加附加的结果,例如,从普通的知识网站(例如,维基百科(Wikipedia)或者YouTube)得到的结果,或者考虑用户过去的偏好,可以提高用户的满意度。在[宫保鸡丁]的例子中,维基百科中关于宫保鸡丁的条目具有有关宫保鸡丁的历史以及变化的有趣信息,而顶部的YouTube结果可能是现实如何制作宫保鸡丁的视频。如果存在没有在“/食谱”斜杠标签中(例如,kungpaochicken.com)的相关的导航查询结果,则将该结果添加到搜索结果中,可以改进搜索结果。用户可以手工地增加结果,或者基于该结果的流行度或被选择的频率,由该用户或者其他用户增加该结果。如果替换的查询返回糟糕的结果(即,结果太少),则不会选择这些结果来将其呈现给用户。可将这种结果降级,将其显示为可点击的链接,或者可将替换的查询结果与初始查询结果合并。图4是根据实施方式的示出服务器系统400的实施方式的框图。服务器系统400可包括至少一个数据处理器或者中央处理单元(CPU)410、一个或者多个可选的用户接口414、用于与其他计算机、服务器和/或客户端通信的通信或者网络接口420、存储器422以及将这些部件彼此耦合的信号线412。用户接口414可具有键盘/鼠标416和/或显示器418。一个或者多个信号线412可组成一条或者多条通信总线。存储器422可包括高速随机存取存储器和/或非易失性存储器,例如,一个或者多个磁盘存储装置。存储器422可存储操作系统432,例如,LINUX、UNIX或者WINDOWS,该操作系统432包括用于处理基本的系统业务以及执行依赖于硬件的任务的程序。存储器422还可在网络通信模块434中存储通信程序。该通信程序用于与客户端(例如,图1的客户端110)进行通信,并可与其他服务器和计算机进行通信。存储器422还可包括服务器400的几个应用,用于执行前面讨论的一个或者多个方法。在应用438中可包括自动斜杠标签模块440,当在客户端装置110接收到用户的搜索请求时,可执行该自动斜杠标签模块440以生成替换的搜索结果。在应用438中可包括查询守护进程模块442,当执行该查询守护进程模块442时,其响应于接收到的搜索查询或者自动斜杠标签模块440发出的指令进行搜索。应用438还可包括web服务器444,其响应于从用户接收到的搜索查询并且在如之前描述的方法所描述的其他操作之后,向客户端装置110提供内容,例如,网页。存储器422还可包括用于存储数据的数据存储器458,所述数据由应用438或者其他服务器和计算机上的应用来访问和管理。存储的数据包括特定索引460,其可存储能够更快的访问的数据,例如,在之前描述的各种类型的预搜索期间,生成并处理的搜索结果。数据存储器458还可包括用于执行搜索并取得内容的传统的搜索索引462,该传统的搜索索引462对本领域技术人员来说是熟知的。图4更多地用于描述可能在分布式数据库系统中呈现的各种特征的功能,而不是用于描述在此所描述的实施方式的结构示意图。实际上,并且本领域技术人员也可意识到,可将服务器400的功能分布到大量的服务器或者计算机上,利用各组服务器来执行那些功能的特定子集。图4中所分别示出的项可以合并,并且可以分割一些项。例如,可以在单个服务器上实施图4中分别示出的一些项,并且可在一个或者多个服务器上实施单个项。分布式数据库系统中的服务器的实际数量以及如何在它们之间分配功能在每个实施中均可不同,并且其可部分地取决于系统存储的信息的数量和/或系统必须处理的数据量。图5示出了根据一些实施方式的可包括客户端装置110(图1)的客户端系统500的实施方式的框图。客户端系统500包括至少一个数据处理器或者中央处理单元(CPU)510、一个或者多个可选的用户接口514、用于与其他计算机、服务器和/或客户端通信的通信或者网络接口520、存储器522以及将这些部件彼此耦合的信号线512。用户接口514可具有键盘/鼠标516和/或显示器518。一个或者多个信号线412可组成一条或者多条通信总线。存储器522可包括高速随机存取存储器和/或非易失性存储器,例如,一个或者多个磁盘存储装置。存储器522可存储操作系统532,例如,LINUX、UNIX或者WINDOWS,该操作系统532包括用于处理基本的系统业务以及执行依赖于硬件的任务的程序。存储器522还可在网络通信模块534中存储通信程序。该通信程序用于与服务器400(图4)进行通信。存储器522还可包括搜索辅助模块538,其可以是浏览器或者浏览器模块。搜索辅助模块538可包括用户数据570,所生成的用户数据非常像用于监控用户的活动的cookie,或者,可基于用户访问的或者与用户相关的一个或者多个URL的内容,或者基于内容站点的内容,远程生成用户数据570。搜索辅助模块538还可包括用于监控用户输入或者用于发送搜索查询的传输/监控模块542,用于接收搜索结果的搜索结果接收模块(未示出),以及用于显示搜索结果的显示模块544。搜索辅助模块538还可包括使用斜杠标签(“/”)540的指令、用于显示搜索结果的显示模块544以及其他用户提供或者请求的内容。在客户端系统500耦合到本地服务器计算机的实施方式中,可将存储器522中的一个或者多个模块和/或应用存储到不同于用户所在的地点的服务器计算机中。在一些实施方式中,存储器522还可包括用于存储和/或维护用户活动历史或者事务历史的事务日志560。存储器522还可包括用于辅助存储的缓存572。以上标识的模块和应用中的每一个对应于用于执行以上所描述的一个或者多个功能的一组指令。这些模块(即,指令组)不需要实现为单独的软件程序、进程或者模块,因此在各个实施方式中,可以合并或者以其他方式重新安排这些模块的各种子集。在一些实施方式中,存储器522或者422可存储上文没有描述的附加的模块和数据结构。图6是根据一些实施方式的按照前面描述的实施方式的用户正在搜索框602中输入搜索请求的屏幕快照。如前所述,当用户在搜索框602中键入“素火鸡(tofurky)”时,在后端正执行预搜索。在用户在搜索查询中已经完成了输入关键词之前,在列表604中向用户呈现可能的关键词列表和/或可选的斜杠标签。例如,当用户在搜索查询中键入关键词时,在列表604中建议与该查询相关的一个或者多个斜杠标签。图7是根据一些实施方式的搜索结果列表的屏幕快照。在该屏幕快照中,用户已经完成了在搜索请求框708中输入搜索关键词(例如,“素火鸡食谱(tofurkyrecipe)”),并且向用户呈现搜索结果列表714。线条710表示执行了预搜索,生成了替换的搜索结果“素火鸡/食谱”并呈现给用户进行观看。响应于用户输入的关键词“素火鸡食谱”,生成替换的搜索结果“素火鸡/食谱(tofurky/recipe)”,并且额外的包括相关的斜杠标签“/食谱”。在一些实施方式中,可删除在该例子中多余的关键词“食谱”,以在呈现最终产生的搜索查询“素火鸡/食谱”中提高效率或者相关性。另外,用户可选择点击链接712,以搜索初始输入的关键词“素火鸡食谱”的结果以及进行另外一个搜索查询“素火鸡食谱/食谱(tofurkyrecipe,recipe)”,与提供的搜索结果列表714相比,该搜索查询“素火鸡食谱/食谱”可能较少的相关。除了上面所描述的各种实施方式之外,将图1的搜索引擎系统102的各种搜索结果返回的用户接口可提供创建、存储和管理斜杠标签的附加功能,其中斜杠标签可由用户生成、自动生成、管理生成和/或由其他用户创建,以便由搜索引擎系统102生成搜索结果,下面将对其作进一步的详细描述。图8是用于浏览与斜杠标签“/自由主义者(liberal)”相关的搜索结果列表的网页浏览器的例子的屏幕快照。搜索引擎的用户能够创建个人搜索引擎账户,其可提供用于创建、存储、管理和共享斜杠标签的大量的个性化的功能以及搜索引擎系统102提供的搜索功能。当执行搜索查询时,可考虑这些自定义的功能以及用户的偏好。例如,一旦用户格雷格已经登陆到他的账户,他能够通过个人斜杠标签功能框822创建并管理斜杠标签和与该标签相关的内容。格雷格还可浏览与他在“我的斜杠标签(myslashtages)”824中已创建的斜杠标签相关的活动。此外,格雷格还能够跟踪选择斜杠标签(该斜杠标签由他或者其他人创建)的动作或者列表826中最流行的斜杠标签。应当意识的是,如由位于列表类别“跟踪(following)”或者“最流行(mostpopular)”旁边的三角形图标所示,可使用已知的技术展开或者折叠列表826。此外,列表826可包括未示出的其他列表类别。在图8的屏幕快照的例子中,搜索结果列表820可基于用户已经添加了用户创建的斜杠标签/自由主义者的用户自己喜欢的列表820,或者该搜索结果列表820可自动生成和/或由自动创建斜杠标签/自由主义者的搜索引擎系统102生成。在其他实施方式中,列表820可以是通过用户的偏好、自动相关或者其他人的偏好的组合而选择的网站的汇总。图8中屏幕快照的例子还包括编辑区域828。编辑区域828包括链接到主编的链接,主编负责编辑内容并对特定搜索种类或者一个或多个斜杠标签的编辑区域进行监控。编辑区域828还包括一个或者多个经过认证的副编辑,副编辑用于对特定搜索种类的内容进行编辑,或者对与显示的搜索结果相关的一个或多个标签的内容进行编辑。副编辑可包括来自私人或公共部门或者上述两者的组合的编辑。还可基于应用进程来选择副编辑,公众可以通过编辑区域828中的链接“申请成为编辑(applytobeaneditor)”可访问该应用进程。图9是偏好用户界面930的图示的屏幕快照,偏好用户界面930用于自定义标签搜索的各种左栏的特征的偏好,例如,我的斜杠标签、跟踪、建议的斜杠标签、最流行等。偏好界面930包括一个或者多个斜杠标签的子文件夹,诸如用户格雷格(greg)的用户可监控该子文件夹。斜杠标签列表可包括可由用户格雷格创建的自定义的斜杠标签、由其他人(例如,格雷格的朋友)创建的斜杠标签、以及格雷格已经选择的自动生成的斜杠标签。图10A是活动选项卡1040的屏幕快照,活动选项卡1040是个人斜杠标签功能框822中的一个功能。个人功能框822在创建并管理斜杠标签的用户活动上提供用户订阅,并且包括与特定用户相关的注释和网站编辑。例如,显示了用户能够编辑或者跟踪的任何斜杠标签的斜杠标签编辑。此外,还显示了注释,该注释显示给用户或者来自用户,或者与用户编辑的或跟踪的斜杠标签有关。图10B是用户的斜杠标签选项卡1042的图示的屏幕快照,斜杠标签选项卡1042是个人斜杠标签功能框822中的一个功能。斜杠标签选项卡1042显示了用户已经创建、可能编辑或者已经获得授权编辑的斜杠标签列表。每个斜杠标签均可具有相关的创建日期、简短说明和/或状态信息(例如,正被编辑)。每个斜杠标签条目还包括与斜杠标签相关的网站的数量、其他相关的斜杠标签、跟踪者的数量、rss订阅、以及可从列表中删除标签的选择,在下面的部分中将对它们做详细的描述。图10C是用户的跟踪选项卡1044的图示的屏幕快照,跟踪选项卡1044是个人斜杠标签功能框822中的另外一个功能。在该选项卡中,用户可增加或者删除斜杠标签,所述斜杠标签是用户想要跟踪或者保持更新以监控对这些斜杠标签的修改的斜杠标签。此外,个人斜杠标签功能框822可包括附加选项卡(未示出),其用于跟踪其他用户的活动或者用户的活动列表,以及他们对斜杠标签的修改和/或注释。还可显示/搜索引擎垃圾指示器1045,其指示用户的个人/搜索引擎垃圾斜杠标签中的/搜索引擎垃圾网站的数量。例如,根据格雷格的用户界面上的/搜索引擎垃圾(3)指示器1045,迄今为止,已向用户指定了3个网站为搜索引擎垃圾。可通过斜杠标签选项卡1042来访问/搜索引擎垃圾列表,或者用户的个人界面可包括附加的“搜索引擎垃圾”标签(未示出)。图10D是用户的/聊天(chatter)选项卡1046的图示的屏幕快照,/聊天选项卡1046是个人斜杠标签功能框822中的另外一个功能。/聊天选项卡1046提供了用户的状态更新以及用户关于公布的注释、编辑、网站、URL、斜杠标签以及其他内容的注释。图10E是用户的/全局(global)聊天选项卡1048的图示的屏幕快照,/全局聊天选项卡1048是个人斜杠标签功能框822中的另外一个功能。该/全局聊天选项卡1048是按时间/日期存储的最近的斜杠标签编辑的列表。图11是搜索结果列表1150的屏幕快照,搜索结果列表1150包括认定的搜索引擎垃圾或者用户可能认作搜索引擎垃圾的项。当用户登陆时,可将对/搜索引擎垃圾斜杠标签的否定添加到每个搜索。这消除了搜索结果列表中已经被用户指定为搜索引擎垃圾的项。通过点击与每个搜索结果项相关联的“搜索引擎垃圾(spam)”链接1152,可快速地将是搜索引擎垃圾的网站或者用户确定为搜索引擎垃圾的网站/搜索引擎垃圾斜杠标签。当将对/搜索引擎垃圾斜杠标签的否定调用到搜索结果列表中时,将会从搜索结果列表中移除那些被指定为搜索引擎垃圾的项,并将更新的搜索列表呈现给观看者(未示出)。图12是登陆到之前描述的一个或者多个实施方式中的搜索引擎系统(例如,图1的搜索引擎系统102)中的用户账户的登陆界面1200的屏幕快照。登陆界面1200包括用于输入用户的姓名和密码以访问多个工具、功能、以及偏好(允许用户自定义用户对搜索引擎系统102的体验)的字段1210。搜索引擎系统允许使用斜杠标签来进行搜索。另外,登陆界面1200包括一个或者多个链接到外部第三方服务提供商的链接,例如,社交网络网站1212,该链接允许用户通过第三方服务提供商(例如,社交网络网站)登录到搜索引擎系统。为了便于说明,登录界面1200显示了允许用户选择经由脸书(Facebook)或者推特(Twitter)登录到搜索引擎102的按钮/链接。通过选择经由外部的社交网络网站,例如,Facebook或者Twitter1212,用户可访问由该外部网站所提供的附加功能,其为除了他们的搜索引擎账户的搜索功能之外的附加功能。搜索引擎系统(例如,图1的搜索引擎系统102)还提供对用户的社交网络账户的数据的访问,以进一步的自定义用户的搜索引擎体验。因此,例如,当用户作出搜索请求时,系统102生成的搜索结果可包括考虑了用户的社交网络的数据或者特定偏好的结果列表。应当意识的是,外部的社交网络网站1212可以是或者可以包括任何的第三方服务提供商网站,并不限于专门的社交网站。外部网站1212可以是提供与用户或者与用户的偏好相关的搜索引擎系统102的数据的任何网站,用户的偏好有助于在用户作出的搜索查询中自定义或者改进搜索结果列表。图13是许可界面1310的屏幕快照,其中,可要求用户设置许可偏好,作为访问外部社交网络的网站的中间步骤。为了便于说明,许可界面1310是请求访问Facebook的例子,当用户选择使用图12的登录界面1200上的Facebook连接链接1212登录时,会弹出该许可界面1310。在一些实施方式中,由外部的社交网络网站提供许可界面1310。许可界面1310可向用户提供功能列表1312,一旦登录成功,便可通过用户的社交网络账户访问用户的搜索引擎账户。在一些实施方式中,功能列表1312中的每个项都可都可链接到附加的许可界面,该附加的许可界面允许用户进一步的自定义搜索引擎将要访问的信息的类型。如果用户对用户的搜索引擎102账户正访问的功能列表1312感到满意,用户可选择访问激活按钮1314中的“允许”按钮,以通过用户的社交网络账户登录到搜索引擎。可选的,用户可选择访问激活按钮1314中的“不允许”,在这种情况下,用户无需访问用户的社交网络账户,即可被重定向到用户的搜索引擎账户。在一些实施方式中,用户可被重定向到登录界面1210,以使得用户无需选择第三方服务网站或者无需具有选择另外一个第三方服务网站的能力,即可重新输入登录信息。图14是根据实施方式的一旦用户已经通过社交网络网站1212登录就提供给用户的搜索界面1400的屏幕快照。搜索界面1400中的一些特征由搜索引擎系统102提供,并且一些特征由用户为了访问搜索引擎而登录到的社交网络网站提供。搜索界面1400包括用于输入搜索词的搜索字段1408。斜杠标签选项卡1410a、活动选项卡1410b和追踪选项卡1410c类似于图10A-10C的选项卡1040、1042和1044,并且上述选项卡1410a、1410b和1410c至少具有与前面描述选项卡1040、1042和1044的功能相同的功能。斜杠标签选项卡1410a包括由用户或者系统102监控或者维护的斜杠标签列表1412。斜杠标签列表1412可以是用户创建的斜杠标签、系统创建的斜杠标签和/或用户选择的斜杠标签(由用户、系统102或者其他用户生成)。斜杠标签选项卡1410a还包括/喜欢斜杠标签列表1414,其中,基于搜索引擎102已经通过用户的Facebook账户(在这种情况下)访问的数据生成/喜欢斜杠标签列表1414。用户以及用户的朋友所具有的该/喜欢斜杠标签列表1414表示他们在Facebook上“喜欢”。一些网站包括“喜欢”图标或者挨着Facebook标记的其他社交网络指示符(例如,参见图16中的1622),当用户在用户的Facebook账户上选择“喜欢”图标或者指示符时(例如,评论页面或者“墙(wall)”),表明用户喜欢相关的网站。搜索引擎系统102可访问已经通过社交网络网站登录到搜索引擎系统102的用户的“喜欢”数据以及用户的朋友的“喜欢”数据,以生成/喜欢斜杠标签列表1414。用户可基于用户或者用户的朋友在用户的社交网络账户中表示的“喜欢”的偏好,进行搜索。列表1412中的斜杠标签的附加属性保留在斜杠标签选项卡1410a内。在“网站栏”1418下面,显示了针对每个斜杠标签、列表1412中所包括的或者标记的网站的数量。例如,从用户的Facebook账户提取的用户或者用户的朋友喜欢的网站的数量由标记1416来表示。在这种情况下,用户和用户的朋友喜欢16,767个网站。因此,当用户在搜索字段1408中输入搜索查询并且该搜索查询包括/喜欢斜杠标签时,会考虑16,767个网站来生成搜索结果。斜杠标签栏1420、追踪者栏1422、rss(rss)栏1424以及删除栏1425提供了有关列表1412中的每个斜杠标签的附加信息。斜杠标签栏1420表示与斜杠标签相关的数据是否与任何其他斜杠标签相关。斜杠标签栏1420显示包括在当前斜杠标签中的斜杠标签的数量。例如,斜杠标签/健康具有包括在该斜杠标签中的另外一个斜杠标签。追踪者栏1422表示是否有其他用户追踪和/或维护斜杠标签。例如,追踪者栏1422表示至少有一个其他用户正追踪/摩托的进展或者修改,并且至少有一个追踪者正追踪/adv。rss栏1424表示是否存在与斜杠标签相关的rss订阅。点击“rss”栏中的图标,可基于给定的斜杠标签,给出搜索的rss订阅。在一些实施方式中,rss订阅可以是多于一个的订阅,和/或可按照日期对rss订阅进行排序。例如,点击与/喜欢相邻的rss图标表示执行搜索[/喜欢/日期/rss]。当在网页浏览器中浏览rss输出时,rss输出使得浏览器提示用户将该rss订阅添加到rss订阅阅读器。删除栏1425使得用户可以从列表1412中选择删除斜杠标签。“删除”栏1425用于编辑斜杠标签列表1412。当删除复选框被选中,并且用户点击位于删除栏1425底部的“删除”按钮时,当前斜杠标签将会被从列表1412中删除。搜索界面1400的其他功能包括斜杠标签过滤列表1430和我的斜杠标签1440,其允许用户添加、移除、分类、维护以及浏览分别由系统102生成和用户创建的斜杠标签。在前面的部分中提供了这些功能的更多细节。搜索引擎102还可以从用户的社交网络账户捕获并显示用户的个人资料图片1450。还可显示来自用户的社交网络账户的其他信息,例如,Facebook在用户的Facebook账户中生成的“您可能认识的人(peopleyoumayknow)”的列表1452。因此,当用户通过社交网络或者另外一个第三方服务提供商登录到搜索引擎时,可分享各种应用和功能,或者可选地,如果用户通过搜索引擎系统102访问第三方服务提供商时,也可分享各种应用和功能。最终,用户具有通过选择选项1454选择偏好或者退出搜索引擎账户的选择权。图15是与用户的账户的/喜欢斜杠标签相关的统一资源定位符(“URL”,例如,网站)的列表1516的屏幕快照。在图15的例子中,搜索查询包括如搜索查询字段1408中的斜杠标签搜索查询1510所示的/喜欢斜杠标签,该搜索查询为用户伯恩斯在搜索结果列表1516中生成/喜欢斜杠标签相关的网站。换句话说,当执行该查询时,如“伯恩斯/喜欢(burns:/likes)”1514所示,生成的搜索结果是用户伯恩斯以及该用户的朋友在Facebook上喜欢的网站。在该示例性的屏幕快照中,搜索结果产生与用户伯恩斯的/喜欢斜杠标签相关的18,237个URL。可以浏览每个网站的附加属性或者动作项1517,例如,网站、排名、搜索引擎优化(seo)以及删除网站的选项。如前所述,搜索结果页面还可包括其他功能,例如,来自用户的Facebook账户的用户的个人资料图片1550。图16-18是当用户通过其他第三方服务登录到搜索引擎时,将用户的社交网络账户或者这些其他第三方服务的信息层叠到搜索结果中的各种搜索查询的例子的屏幕快照。在图16的第一个例子中,在搜索查询字段1408中输入搜索查询词[blekko]1610,可生成与Blekko相关的各种网站的搜索结果1612。因为用户已经通过用户的Facebook账户登录,所以在每个搜索结果的网站标记字符串1616中均显示了附加的网站标记“喜欢(like)”。该“喜欢”标记1620是社交网络指示符的一个例子。在这种情况下,选择“喜欢”标记1620表示用户偏好或者“喜欢”该链接或者结果项。如果可从用户的Facebook账户获得“喜欢”信息,就还为每个搜索结果项提供“谁喜欢”行1614。该“谁喜欢”行1614列出了表示他们喜欢相关的网站的一个或者多个用户。还可指示出表示他们喜欢该网站的人的总数。例如,在搜索结果项中显示的“你、亚伦·赫莉以及其他28个人喜欢(likedbyyou,AaronHurley,and28others-view)”表示用户以及用户的朋友“亚伦·赫莉”都喜欢网站“blekko.com”。另外,该用户的其他28个朋友也喜欢网站“blekko.com”。在另外一个搜索结果1624b中,该用户的其他217个朋友喜欢搜索结果列表1612中的第二个网站。在一些实施方式中,基于相关性和等级的计算(例如,在其他部分描述的相关性确定),确定在“谁喜欢”行1614中显示谁的名字。在一些实施方式中,从“谁喜欢”行1614中选择的名字将用户重定向到选择的朋友的Facebook的个人主页。该重定向可包括在新浏览器或者用户界面中提供朋友的Facebook的个人主页,或者在同一个浏览器或者用户界面上提供新的选项卡。列表1612中的一些搜索结果项不提供“谁喜欢”行,这是因为,例如没有用户喜欢的网站、用户还没浏览该网站或者没有任何用户的朋友已表示他们是否喜欢特定的网站。搜索结果项1626a、1626b是两个网站的例子,其中,没有获得“谁喜欢”信息,因此没有显示该信息。另外,用户可表示他喜欢[blekko]的搜索结果,并可决定通过选择分享图标1622中的一个来与其他人分享该搜索结果,这为用户提供了将搜索结果作为“喜欢”网站发送到用户的Facebook主页中或者在Twitter中“推特”该搜索结果的选项。在一些实施方式中,用户可以可选地基于与/喜欢斜杠标签相关的数据来设置偏好,以调整或者修改结果列表1612。例如,用户可以可选地请求基于喜欢每个网站的人的数量生成搜索结果并对生成的搜索结果排序。因此,来自Facebook数据的“喜欢”的计数非常重要,其可影响搜索结果列表的排序。例如,可将搜索结果的搜索排序配置为,将具有较多的“喜欢”的网站放在靠近列表的顶部位置进行显示,并将具有较少或者没有“喜欢”的网站放在列表的较低位置。在一些实施方式中,用户可通过点击“喜欢”类的图标(未示出)来请求对搜索结果的排序作出这种改变。图17是另一个例子的基于搜索查询[披头士]1710的另一个搜索结果。搜索查询[披头士]1710的搜索结果列表1712作为另一个图示而示出,并与图18的下一个屏幕快照进行比较。与图16的搜索结果列表1612类似,搜索结果列表中的每个与“披头士(thebeatles)”相关的网站均在网站标记行1716中包括“喜欢”网站标记1720,并且如果有的话,可包括“谁喜欢”行1714。例如,结果项1724a和1724b中具有来自用户和用户的朋友的与网站相关的“喜欢”信息。然而,在搜索结果项1726中没有显示任何的“喜欢”网站的信息。图18是当/喜欢斜杠标签包括在搜索查询中,即形成[披头士/喜欢(thebeatles/likes)]1810时,图17的搜索结果可被如何修改的例子。通过在搜索查询中包括/喜欢斜杠标签,可生成与搜索结果列表1710不同的搜索结果列表1812,其中,当生成搜索结果时,只考虑用户或者用户的朋友已经表示他们喜欢的披头士网站。因此,列表1812中的每个结果项均包括“谁喜欢”行1814a-g。每个“谁喜欢”行均显示来自用户的Facebook账户喜欢相关的网站的一个或者多个人以及喜欢该网站的人的总数。如前所述,可基于用户偏好的一些等级或者排序标题来确定“谁喜欢”行1814的显示,或者由搜索引擎系统102确定“谁喜欢”行1814的显示。图19是根据其他实施方式的、搜索界面的另一个功能的例子的屏幕快照。在一些实施方式中,选择“喜欢”网站标记链接会弹出窗口1942,其允许用户将相关的网站添加到用户的一个或者多个斜杠标签。在该例子中,当输入搜索查询[摩托车/喜欢(motorcycle/likes)]1910时,用户可为搜索结果列表1912中的任何网站添加用户希望的任何斜杠标签,例如,添加列表1430、1440中的任何斜杠标签。在屏幕快照的例子中,用户正为第一结果项“msf-usa.org”添加斜杠标签/摩托1946。窗口1942中的其他功能可允许用户从斜杠标签中删除网站,例如,用户/喜欢列表1948。用户还可以将网站标记为用户喜欢的一个网站,并通过点击Facebook的“喜欢”按钮1950,将该偏好发送到用户的Facebook账户。图20是根据一些实施方式的搜索界面的另一个功能的例子的屏幕快照。作为另一个图示,显示了由使用/喜欢斜杠标签的搜索查询[宝马摩托车/喜欢]生成的另一个搜索结果列表2012。只将用户或者用户的朋友表示他们喜欢的网站认作搜索结果。对于每个结果项中的“谁喜欢”行来说,提供了附加功能“-浏览(view)”2020。当用户选择“-浏览”功能2020时,会弹出窗口2022,在该窗口2022中列出了喜欢搜索结果列表2012中的相关网站的所有朋友。例如,“Facebook的朋友喜欢的:(Facebookfriendsliked)”窗口2022对应于喜欢第一结果列表项中的网站“bmwmortocycles.com”的10个朋友。也就是说,用户Benlower加上8个其他喜欢这个网站的朋友。Benlower显示在第一结果项的“谁喜欢”行。当选择“-浏览”链接2020时,列出了喜欢该网站的其他朋友。通过使用滚动栏2028向上和向下滚动界面,可浏览所有的朋友。在一些实施方式中,从列表2024中选择的用户将界面重新定向到朋友的Facebook的个人主页。其他有用的斜杠标签工具可用于加强搜索查询,并能生成更相关的和/或自定义的搜索结果。提升斜杠标签使斜杠标签具有了提升的排名的能力,这样一些结果就会出现在生成的结果列表的较高位置。搜索引擎结果页面(SERP)通常以一定的顺序呈现,例如,通过URL的排名(针对/相关性分类)或者通过URL的浏览器日期(针对/日期分类)来确定该顺序。利用提升的斜杠标签和/相关性分类,在斜杠标签中呈现的SERP获得了提升的排名,这样与在较少的斜杠标签搜索的结果中的位置相比,它们看起来在结果中的位置更加靠前。基于一个或者多个提升(boosting)算法或者一个或多个标准,可给予内容提升的排名,这可使得被提升后的内容变得相关,否则,在非提升的斜杠标签搜索中,该内容会被忽视掉。提升生成SERP,SERP可能来自基于提升标准而选择的更广的混合主题。例如,提升标准可基于收集的意见、或者社区内的评论、或者在其他站点处的列表中的高排名站点,以及可基于特定的行业、领域、主题、流行文化等。提升标准可基于流行度、点击频率、提问频率、趋势等。它包括增加SERP或者一组SERP的相关性或者权重以使其与提升的斜杠标签相关的任何理由,其中提升的斜杠标签表面看起来或者在普通搜索中可能不是显然相关的。例如,普通的斜杠标签使用[/foo]仅显示斜杠标签中的页面。任何斜杠标签既可以正常使用也可以用作提升[+/foo]。在提升模式,结果将包括混合在一起的在斜杠标签/foo中的网站和不在斜杠标签/foo中的网站;结果的排序受到提升的影响。当搜索查询包括含糊不清的术语或者具有多重定义或关联的术语时,提升是有用的。当常用术语具有合适的关联名或者社会/文化含义时,提升也是有用的。例如,“燕麦片”可能与食谱以及食品网站相关,或者它可能是与流行的连环漫画相关的名字。有多种方式来确定与提升的斜杠标签相关的网页的提升排名。在搜索查询中提升斜杠标签的最终结果可能生成混合在一起的提升的和未提升的结果。然而,用户可请求结果列表仅显示提升的结果。现在以举例说明的方式描述提升的斜杠标签的语法。/foo斜杠标签将结果限制到仅与/foo斜杠标签相匹配的URL。提升的斜杠标签可由语法+/foo来表示。该斜杠标签既可用于普通模式/foo,也可用于提升模式+/foo。在一些实施方式中,当指定搜索查询时,用户可决定什么时候使用普通的斜杠标签,或者什么时候使用提升的斜杠标签。在其他实施方式中,可由搜索引擎102或者基于用户的偏好,以之前所描述的分配或者识别斜杠标签的多种方式,来自动地使用提升的斜杠标签。例如,当用户键入“燕麦片”+“连环漫画”时,便会自动地启用提升的斜杠标签。图21包括根据一些实施方式的显示如何使用提升的斜杠标签生成搜索结果的屏幕快照图示。为了便于说明,示出了针对主题“燕麦片(oatmeal)”的不同类型的搜索查询。在第一搜索查询结果2110中,术语“燕麦片”的常规搜索(例如,不使用斜杠标签或者提升)生成涉及主题“燕麦片”的网站列表,但是以一般或者宽泛的方式生成了上述网站列表。为了示出能够以宽泛的范围的方式使用术语,查询结果2110包括名为“燕麦片”的连环漫画的网站、Twitter上关于燕麦片的评论、维基百科对燕麦片的一般描述和定义、每日绿色网站上的使用燕麦片的健康益处等。使用斜杠标签/食谱对术语“燕麦片”进行查询的第二搜索结果2120生成了范围较窄的搜索结果。该搜索结果列表包括与食物相关的网站,网站可包括“燕麦片”的食谱信息。在第三搜索结果2130中,术语“燕麦片”的查询加上了提升的斜杠标签+/食谱。“燕麦片”和/食谱的提升的查询生成了与术语“燕麦片”相关的排名靠前的网站,其包括那些与“食谱”相关的网站、以及可能不涉及到“食谱”,但是与“燕麦片”很相关以至用户可能会对它们感兴趣的其他排名靠前的网站。在一种提升方法中,举例来说,可基于专家和公众的意见,给予SERP提升,其中专家和公众的意见会影响与提升的斜杠标签类别相关的内容。落入该类别中的SERP可包括在提升的斜杠标签的搜索结果中。可由一个或者多个专家、或者专家社区编辑并管理与提升额斜杠标签相关的内容,其中由专家确定与斜杠标签类别或者斜杠标签子集最相关的页面。专家可以是主编、副编、或者私人或公共领域的专家。甚至可将专家宽泛地定义为包括潮流引导者或者追随者、或者在互联网上或者其他方面积极参与发布的内容的任何用户(例如,编辑)。这些专家可通过使用手工或者自动的过程创建、更新以及管理与斜杠标签相关的内容,来进行这种确定。在另外一个例子中,可从专家网站和对与斜杠标签相关的信息进行维护的互联网上的其他地方来提取专家内容。换句话说,可基于提升的范围,来推导或者包括来自能够可靠的生成与斜杠标签的主题相关的信息的网站的内容。例如,诸如新闻和杂志网站的外部网站可包括有用的排名数据,并且如果这种网站通常被认为是可靠的并且在本领域中是知名的,那么来自那些网站的内容就可被认作是专家网站和部分专家专区。在其他例子中,可基于诸如最流行、频繁访问、有信誉的高品质内容、品牌名称等标准识别这些可靠的内容源。可使用自动的、人工的、算法的或者组合的方法来访问来自这些内容源的信息。“社区”可以是社交网络的社区,或者一些其他的第三方社区,在社区中,用户可分享内容、意见并可对分享的内容作出响应。因此,专家确定可基于在用户的社交网络或者更宽泛意义上的网络中的人们的评论以及偏好。由社区或者社区的子集分享的数据可用于排名以及对提升的确定。当搜索查询包括提升的斜杠标签时,可呈现由专家选择的排名靠前的结果。在一些实施方式中,通过“提升公式”来给出对排名的提升,“提升公式”可包括强调一个或者多个搜素结果项或者搜索结果列表的相关性的多种方式。例如,该提升公式可以是算法。算法的例子包括给排名加上常数、给排名乘以系数、或者对排名计算的一个或者多个部分应用更加复杂的公式。在一些实施方式中,可实施人工输入和算法相结合的方法,来确定提升排名。提升的斜杠标签还可与其他功能组合在一起使用。例如,用户的/全部斜杠标签(即,/格雷格/all)是用户的斜杠标签的组合,并且用户的/全部全部斜杠标签(例如,/格雷格/allall)是用户能够编辑或者用户正在追踪的每个斜杠标签的组合。例如,用户格雷格已经被许可编辑/blekko/早期音乐以及麦克/素食主义者,并追踪/萨姆/埃塞俄比亚。将+/格雷格/全部(+/greg/all)或者+/格雷格/全部全部(+/greg/allall)添加到格雷格确定想要提升格雷格感兴趣的全部结果的每个搜索中,其中格雷格不需要指定特定的斜杠标签。在一些实施方式中,如果选中了偏好复选框,+/格雷格/全部或者+/格雷格/全部全部就会被添加到用户格雷格作出的每个查询中。提升的斜杠标签还可与另外一个斜杠标签/历史很好地结合在一起。/历史斜杠标签包括用户以前点击的URL(例如,/格雷格/历史),该URL可以仅是在blekkoSERP中的点击的URL,或者在其他实施方式中,该URL是用户在任何浏览器中点击的全部URL,可能是由浏览器扩展或者工具栏收集该全部URL。如果格雷格希望重新找到上周的网站,并且他记得出现在该网站上的一些词语(例如,“古大提琴”),那么通过搜索[古大提琴/历史],即可找到正确的网站。提升的斜杠标签+/历史将会提升用户过去浏览过的所有网站。用户可能会在一些搜索中选择包括+/历史,并且喜欢将以前提到的功能+/全部全部添加到每个搜索中,用户偏好中的复选框能够指示搜索引擎将+/历史添加到所有的搜索中。可以类似地提升/喜欢斜杠标签(+/喜欢),以增加+/喜欢中的任何结果的相关性的权重。并且如果选中了偏好复选框,就会将+/喜欢自动地添加到每个查询中。/历史斜杠标签可被扩展到包括用户的浏览历史和用户的所有朋友的浏览历史。可将该组合的斜杠标签命名为/所有历史。应当意识的是,从隐私的角度来说,/历史斜杠标签应该得到特别的对待。在一些情况下,如果将用户的全部网站浏览历史曝光在公众的视野下,很多用户会由于个人原因而感到尴尬,例如,曝光用户的偷窃数据或者前配偶的传票。当/历史斜杠标签的内容存储在图1的搜索引擎102的服务器上时,为了保护/历史斜杠标签的内容,可使用用户提供的秘钥对标签的内容进行加密,并且只有在每次使用/历史斜杠标签时,才进行解密。或者,当用户每次登陆到搜索引擎系统102时,可对/历史的内容进行解密,并且在用户已经进行了预定时间(如15分钟)的处理之后,丢弃未加密的内容。使用这些方案中的任意一个,未加密的数据就会很少出现在搜索引擎102的服务器上。图22是根据一些实施方式的示出搜索结果2210的框图,其中,使用与来自一个或者多个社交网络网站的内容相关的搜索算子(例如,/签到(checkin)斜杠标签)生成搜索结果2210。这些搜索算子使得搜索引擎102在生成搜索结果时,将从社交网络网站收集到的内容(例如,轮询数据)作为相关标准。这些搜索算子可能与来自一个或者多个社交网络网站的一类内容相关。例如,/签到斜杠标签是为外部网站(例如,foursquare.com,Facebook.com或者其他社交网络网站)的用户签到数据而创建的专门的斜杠标签工具。当朋友签到例如商业性场所或者地点时,他们可能会表示他们已经去过那个特定的商业性场所或者地点。一些网站允许朋友对商业性场所或者地点作出评价。通过使用算法或者软件模块,签到数据可用于进一步的改进或者指定相关性标准,以进行搜索查询。该功能允许用户对搜索查询作进一步的自定义或者个性化。回到用户格雷格的例子,如果格雷格对搜索本地餐馆感兴趣,格雷格可能会喜欢浏览格雷格在Facebook网络上的朋友喜欢的餐馆、或者格雷格的朋友在foursquare.com或者Facebook上签到的餐馆。在图22的例子中,格雷格输入搜索“意大利餐馆(Italian/restaurant/checkin)”,但是他只对他的朋友已经签到的餐馆感兴趣。搜索结果项2220,Mescolanza,出现在了搜索结果的顶部。可在每个结果(例如,结果2220)的下方显示已经对特定的地点进行签到的朋友列表,类似于前面所述的如何显示喜欢。当使用/签到斜杠标签时,每个搜索结果项2220还在行2230上显示签到的是用户的哪个朋友。例如,格雷格的朋友里奇和麦克都签到了Mescolanza。格雷格可以使用行2230上的浏览链接来浏览已经签到Mescolanza2220的所有朋友。也可提升/签到斜杠标签,即+/签到。最后,签到的数量或者(签到+喜欢)的数量可用于以不同的顺序对结果进行重新排序。例如,基于以前所描述的任何一个排名确定方法,Mescolanza2220可出现在结果列表的顶部。可选的,将Mescolanza2220置顶的排名确定可基于以下情况或者可受到以下情况中的额外的因素的影响:一个或者多个格雷格的朋友是否喜欢Mescolanza2220,和/或考虑到格雷格的朋友之前在外部网站(例如,foursquare.com或者Facebook)对指定的搜索结果的打分或者评论。在一些实施方式中,可考虑将“喜欢”和“签到”相组合的标准,以生成搜索结果排名,或者对搜索结果进行重新排名。来自朋友之外的人的签到数据总体上来说也是有用的,其可有助于确定哪些地点流行,或者24小时营业。然而,综合性的签到数据与朋友的签到相比,更容易受到垃圾信息的影响。因此,需要通过反垃圾信息算法对综合性数据进行仔细的检查。有些时候,难以将签到数据与餐馆、酒吧和商业性场所的实际网站相关联。签到网站经常为每个知名的商业性场所生成他们自己的网页,而在这些网页中,只有少量的网页具有指示到由商业性场所直接维护的所谓的“主页”的指示符。在一些实施方式中,对主页进行了确定,或者去除了签到网站以识别主页,并且生成的搜索结果可提供主页。例如,签到网站(例如,foursquare.com或者Facebook)的URL可用于推断主页,推断出的主页可随后用到搜索结果中。搜索结果列表可只包括主页、或者与搜索查询相关的主页和非主页的混合。应当意识到的是,签到数据并不限于餐馆,并可应用于任何的主题或者分类。例如,签到数据可应用于电影、娱乐场所、度假胜地、酒店、其他商业性场所等。还应当意识到的是,可应用类似的技术,以使得搜素结果包括来自其他服务网站或者社交网站的数据,其中,可在生成的搜索结果中,利用用户的偏好、意见、评论等,例如,Facebook上的朋友的偏好/喜欢,或者Yelp上的评论。可组合两个或者更多的斜杠标签来进行特定类型的搜索。例如,两种斜杠标签的特定组合可用于答复查询,例如,[披萨旧金山]。首先是/本地,其包括了特定区域内的所有商业性场所,其次是/吃,其包括了供应食物的商业性场所。/本地和/吃都被分成了多个子标签,例如,/本地/94085(邮编中的所有商业性场所)以及/吃/旧金山(加利福尼亚州旧金山这个城市中所有的供应食物的商业性场所)。在另一个实施方式中,/本地/红木市可被定义为一组邮编斜杠标签(例如,/本地/94085)的组合。可组合使用社交网络数据(例如,偏好和签到),以修改或者改进使用斜杠标签或者斜杠标签的组合的搜索查询的相关性标准。例如,在[披萨/吃/旧金山]的搜索结果中,显示出喜欢以及朋友的签到是有用的。同样的,用户可选择对喜欢或者签到的搜索结果进行提升(例如,[披萨+/喜欢+/签到/吃/旧金山]),或者该提升可以是默认的,或者由用户偏好中的复选框控制。自动击发(Aurofiring)是另外一个搜索功能,其对一个或者多个斜杠标签进行预测,以将接收到的搜索查询转换为斜杠标签查询。用户从而能够使用普通的搜索词,而无需了解现有的斜杠标签,并且用户期望将合适的斜杠标签分配给查询。例如,/本地和/吃斜杠标签都是自动生成斜杠标签的好目标。通过将旧金山识别为一个城市的名字、并将披萨识别为一种类型的食物的名字的算法,可对搜索[披萨旧金山]进行转换。因此,自动击发将查询转换为[披萨/吃/旧金山]。自动击发可用于将任何查询转换为相关的斜杠标签格式。图23是根据一些实施方式的使用基于本地的斜杠标签生成并在显示器2310上显示的搜索结果的例子的框图。即使搜索没有指定地理区域,来自/本地或者/吃的搜索结果也是有用的。例如,用户的位置是已知的(通过进行搜索的IP地址的地理位置或者用户的偏好来获得用户的位置),并且对于普通搜索来说,如果搜索结果得到搜索查询2320中的搜索词的证明,则可在搜索结果2330中显示针对本地区域的一些结果的单框(one-box)字段2340。可使用自动生成功能来确定搜索查询是否允许在特定的结果框2340显示。例如,位置包括邮编94085的用户在搜索查询框2320中的查询[披萨(pizza)]可能会使得单框2340除了显示[披萨]的一般搜索结果外,还显示搜索[披萨/吃/94085]的几个结果。因此通过自动生成功能将搜索[披萨]转换为[披萨/吃/94085]。自动生成还可利用提升的斜杠标签功能。如果自动生成功能确定多个斜杠标签均与查询相关,那么除了只取出一个斜杠标签之外,还可显示通过使用多个提升的斜杠标签而得到的搜索结果。例如,斜杠标签/健康和斜杠标签/癌症对查询[肺癌]来说,分数都很高。较好的方案是通过自动生成功能来选择这两个斜杠标签,但是如果这两个斜杠标签的分数接近,结果[肺癌+/健康+/癌症]将会是最好的。图24是根据一些实施方式的查询协调系统的框图。再次参考图1的搜索引擎系统102,搜索索引存储在集群116处的服务器(例如,图24的服务器2420)上的磁盘上,其中每个数据桶复制三次2430a-2430c(R3)。在一些实施方式中,服务器2420是本地服务器。协调服务器2410可以是集群116中的一个或者多个服务器,或者可以是集群116之外的服务器但是被指定为协调服务器2410。协调服务器2410与服务器2420进行交互,以从服务器2420管理的、存储在2430和/或2450的索引中获取查询数据。可能希望将该数据存储到固态硬盘(SSD)2450,但是对于搜索引擎而言,数据通常非常庞大,而且SSD2450比一般的磁盘要贵很多。在一些实施方式中,可在SSD2450上将一部分索引存储为R3,这使得更多的数据能够适于少量的较小的SSD。这可通过将索引分成两部分来实现,即较重要的部分(称作“头”)和较不重要的部分(称作“尾”)。有多种方式来实现上述方案。索引可利用URL排名,该URL排名是在不考虑任何特定的查询词的情况下,对URL的排名。另外一个可选的方案包括主机排名,或者针对每个单独的查询词,对URL进行排名。URL排名和主机排名具有理想的属性,即,对于所有查询来说,无论是在索引的头部还是尾部,特定的URL都将具有该特定URL的100%的数据。可由一个或者多个服务器2420对索引的头部和索引的尾部相应地进行复制、标记和存储2430、2440。索引的头部可随后以比尾部的复制等级高的复制等级存储到SSD2450中。在该例子中,更相关的索引是三个复制R32430a-2430c,而尾部索引是一个复制R12440。这样设置的首要好处是:使用的SSD总存储量远小于存储R3处的全部索引所需的存储量。当服务器2420对查询进行评估时,将该查询发送到多个服务器2420,每个服务器将结合本地存储的索引的碎片(例如,存储在同一个服务器上)2430评估查询。这些服务器2420中的一部分在计算对搜索的应答时,比其他服务器慢很多,并且正协调查询的服务器最终放弃那些在最终期限内没有完成的服务器。将头部存储在R32430,则三个不同的服务器(服务器1、服务器2和服务器27)分别对头部的每个碎片进行操作,这使得协调服务器2410不太可能在最终期限内接收不到索引的全部头部的应答。应当意识到的是,在此所描述的一个或者多个特征可与另一个特征合并,和/或还可包括下述文献中的一个或者多个特征,或与下述文献中的一个或者多个特征合并:临时专利申请61/218,889,临时专利申请61/408,606,临时专利申请61/420,267,以及PCT申请PCT/US10/39395,通过引用的方式将其合并于此。还应当意识到的是,上述的多个元件共享同样的参考标号,其中对这些元件的相应的描述也共享同样的参考标号。为简洁起见,没有再次描述这些元件的共同的说明。为了解释的目的,前面的描述已参考了具体的实施方式。然而,上述示例性的讨论并不是意在穷举或者将本发明限制到所公开的具体的形式。根据上面的教导,对本发明做出一些修改或者变化是可能的。所选择并描述的实施方式是为了最好地解释本发明的原理及其实际应用,从而使本领域技术人员能够最好的利用本发明,并且进行了各种修改的各种实施方式适合于设想的各种应用。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1