搜索结果的多样化和过滤的制作方法

文档序号:15575454发布日期:2018-09-29 05:25阅读:165来源:国知局

当前,搜索引擎(或在线搜索服务)向请求计算机用户提供搜索结果集合(每个搜索结果是到相应在线文档或内容的超链接),搜索结果集合被认为是相关的并且响应于给定的搜索查询。一般而言,搜索结果集合通常根据内容/文档与搜索查询的相关性、对应内容/文档的流行度、以及在有限情况下计算机用户提交搜索查询的意图的多样化来被排名或排序。

网络上的内容语料库正在快速、可能指数的速度增长,并且因特网上可用的新内容的大部分包括用户生成的内容。作为说明而非限制,用户生成的内容可以包括对诸如电影、政治情况、餐馆等各种项目的个人评论。当然,这些用户生成的内容项通常带有作者对评论项目的观点或意见,一些表示积极意见,一些表示消极意见,甚至一些可能指示作者是中立和/或不关心的。

在包括针对用户生成的内容的结果的搜索结果的上下文中,如果具有积极(或消极)观点的评论/用户生成的内容项更受欢迎,则搜索引擎的结果自然主要包括具有积极的(或消极的)观点的内容项。流行度的结果将是具有备选的或中立观点的用户生成的内容将被模糊和/或掩盖,即使它们可以表示在搜索结果集合中期望的有价值信息。

类似地,用户生成的内容的来源还可以掩盖或模糊在搜索结果集合中期望的有价值信息。例如,计算机用户经常转向流行的、通常是商业的针对关于诸如旅馆的特定场所的信息的源。虽然存在以用户反馈和评级的形式(其为用户生成内容的形式)提供酒店信息的若干流行的源,但通常有价值的信息可以在个体的博客(也是用户生成的内容)中找到,但由于流行度的典型的缺乏,信息不会显露在搜索结果集合中。



技术实现要素:

提供以下发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的概念的选择。发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。

根据所公开的主题的各方面,提出了一种用于用多样化搜索结果来响应来自计算机用户的搜索查询的系统和方法以及体现该系统和方法的计算机可读介质。响应于搜索查询,满足搜索查询的搜索结果集合被标识。搜索结果集合根据与请求计算机用户相关联的多样化准则被重新排序。多样化准则可以包括观点、内容源和/或其比率中的任意一个。一个或多个搜索结果页面根据重新排序的搜索结果集合被生成,并且响应于搜索查询,返回给请求计算机用户。

根据所公开主题的其他方面,提出了如在计算设备上实现的、用于用多样化搜索结果来响应来自计算机用户的搜索查询的方法。响应于来自计算机用户的搜索查询,满足搜索查询的搜索结果集合被标识。搜索结果集合根据搜索查询的查询项被标识,并且该搜索结果集合是有序的搜索结果集合。搜索结果集合然后根据多样化准则被重新排序,并且至少一个搜索结果页面根据重新排序的搜索结果集合被生成。响应于搜索查询,搜索结果页面被返回。

根据所公开主题的其他方面,提供了承载计算机可执行指令的计算机可读介质。当在包括至少一个处理器的计算系统上执行时,计算机可执行指令执行用于用多样化搜索结果来响应来自计算机用户的搜索查询的方法。该方法包括根据搜索查询的查询项来标识满足搜索查询的搜索结果集合。该搜索结果集合是有序的搜索结果集合,根据与搜索查询有关的每个搜索结果相关联的得分被重新排序。搜索结果集合根据多样化准则被重新排序。根据多样化准则来对搜索结果集合进行重新排序包括根据多样化准则来修改搜索结果集合的每个搜索结果的得分,并根据搜索结果的经修改的得分来对搜索结果集合进行排序。至少一个搜索结果页面根据重新排序的搜索结果集合被生成,并且至少一个搜索结果页面被响应于搜索查询返回。

根据所公开主题的又一些方面,提出了一种用于用多样化搜索结果来响应来自计算机用户的搜索查询的计算机系统。该计算机系统包括处理器和存储器,其中所述处理器执行被存储在所述存储器中的指令,该指令作为附加组件的一部分或与附加组件结合以响应搜索查询。这些附加组件至少包括搜索查询模块、搜索结果标识模块、搜索结果多样化模块、内容分类器和搜索结果页面生成器。在执行中,搜索查询模块从计算机用户接收搜索查询,并用生成的搜索结果页面中的一个或多个搜索结果页面来响应计算机用户。就其本身而言,搜索结果标识模块标识满足来自计算机用户的搜索查询的有序搜索结果集合。搜索结果多样化模块根据与计算机用户相关联的多样化准则来对搜索结果标识模块的有序搜索结果集合进行重新排序。内容分类器标识多样化属性,包括由有序搜索结果集合引用的内容的内容观点、内容源和用户生成内容,搜索结果多样化模块依赖于该多样化属性。搜索结果页面生成器根据重新排序的搜索结果集合来生成一个或多个搜索结果。

附图说明

所公开的主题的前述方面和许多伴随的优点将变得更容易理解,因为通过结合以下附图参考以下描述它们被更好地理解,其中:

图1是图示了根据所公开主题的各方面的如在适当配置的搜索引擎上执行的、用于响应来自用户的搜索查询的示例性过程的框图;

图2是图示了根据所公开主题的各方面的用于响应来自用户的搜索查询的示例性例程的流程图;

图3是图示了根据所公开主题的各方面的编码有用于操作搜索引擎的指令的示例性计算机可读介质的框图。

图4是图示了根据所公开主题的各方面的被配置为搜索引擎的示例性计算设备的框图;以及

图5是图示了适合于实现所公开主题的各方面的示例性网络环境的框图

具体实施方式

为了清楚起见,本文档中术语“示例性”的使用应被解释为用作某事物的说明或示例,并且不应将其解释为该事物的理想和/或主要说明。在格式上,当词语或术语后跟“(s)”时,取决于是否存在术语/项目的一个实例或是否存在是术语/项目的一个或多个实例,该含义应被解释为指示单词或术语的单数或复数形式。例如,术语“用户”应当被解释为一个或多个用户。

术语“搜索查询”应当被解释为从计算机用户到搜索引擎的提交,该提交用作从计算机用户到搜索引擎的、针对满足搜索查询的查询项(搜索查询的基础)和/或与搜索查询的查询项(搜索查询的基础)相关的内容的请求。搜索引擎(也称为在线搜索服务)返回的内容通常包括搜索结果集合,并且可选地包括与搜索查询相关和/或响应于搜索查询的其他信息。为了清楚起见,搜索结果是对计算机用户通过网络可访问的内容项/文档的引用(通常以超链接的形式)。搜索结果可以包括引用内容的一些部分作为描述性“片段”,使得请求计算机用户可以考虑引用内容是否表示期望内容。

根据所公开的主题的各方面,关于根据各种多样化准则使搜索结果多样化,特别是(但不是排他地)关于用户生成的内容,呈现系统、方法、过程等。根据各种实施例,多样化准则可以由通过搜索查询的方式请求搜索结果的计算机用户来提供,即用户提供的多样化准则。用户提供的多样化准则可以由搜索引擎存储为计算机用户的一个或多个用户偏好。根据各种实施例,用户提供的多样化准则可以包括,作为说明而非限制,关于内容和/或源信息的观点。观点的示例包括(作为说明而非限制):表达关于内容的主题的全部或一些的积极或有利的见解和/或态度的积极观点;表达关于内容的主题的全部或一些的消极或不利见解和/或态度的消极观点;以及中立的情绪,其中内容的特定主题通常不表达积极或消极的观点/态度。除了观点之外,用户提供的多样化准则还可以包括对源类型的指示,诸如商业源或非商业源。商业源的示例包括其托管(或以其他方式可用)用户生成的内容的主要目的是用于商业目的的源,诸如社交网站/服务、评论服务、新闻源等。与商业来源相反,非商业来源包括,作为说明而非限制,用户博客、独立发布等。

为了说明用多样化搜索结果响应来自计算机用户用的搜索查询的过程,尤其是关于用户生成的内容,现在参考附图。图1是图示了根据所公开主题的各方面的、如在适当配置的搜索引擎上执行的、用于响应来自用户的搜索查询的示例性过程100的框图。可以理解,计算机用户101(通过用户计算机120)将向搜索引擎122提交搜索查询102。响应于搜索查询并且如框104所指示的,搜索引擎122根据搜索查询102的查询项从内容索引106中标识与搜索查询相关/有关的搜索结果。与搜索查询相关和/或有关的搜索结果被认为是满足搜索查询的搜索结果,即,基于搜索查询的查询项被认为满足搜索查询的查询意图的搜索结果。作为说明,搜索结果集合107图示了由搜索引擎响应于搜索查询102而取回的搜索结果的示例性集合。可以看出,搜索结果集合107包括被标识为满足搜索查询的内容项和对应的相关性得分,例如,文档1具有得分1的相关性得分,文档2具有得分2的相关性得分等。一般而言,相关性得分是表示所引用的内容与搜索查询102的主题的相关性的强度的相对值。

根据所公开的主题的各方面,然后根据多样化准则(包括用户提供的多样化准则)使所识别的内容多样化,如框108所示。如上所述,用户提供的多样化准则是从用户偏好获得的(临时且明确地提供或基于用户偏好存储库110中的已建立的偏好)。具体地并且根据所公开的主题的各方面,根据计算机用户关于观点和/或内容源的偏好来进行个性化。在该个性化排名中,根据用户的偏好来修改与所标识的搜索结果集109的文档相对应的得分。当然,诸如观点和/或源的信息可以根据需要(即,以即时方式)确定,或者可以预先建立并存储在内容索引106中。作为说明,搜索结果集合107'的得分根据用户提供的多样化准则被更新,例如,文档1现在具有得分a的相关性得分,文档2现在具有得分b的相关性得分等。当然,尽管搜索结果集合107'中显示的文档的顺序与搜索结果集合107中的相同,这不是顺序的指示,而是简单地表示在个性化之后文档的得分可能改变。

在根据用户提供的多样化准则对搜索结果(更具体地,搜索结果的对应得分)进行个性化之后,搜索引擎122然后生成一个或多个搜索结果页面,如框112所示。将理解并且根据所公开的主题的各方面,搜索结果页面由搜索结果生成器生成,使得如由框108的个性化确定的、被认为与搜索查询更相关的那些搜索结果被包括在响应于搜索查询102被返回给计算机用户的第一结果中。以这种方式,被视为不太相关并因此不太可能吸引用户的那些搜索结果被呈现在后续搜索结果页面中(如果它们被计算机用户请求)。

在搜索结果页面被生成之后,诸如搜索结果页面114的搜索结果页面被返回给计算机用户。

图1中所示的过程100还关于流程图被进一步讨论。具体地,图2是图示了示例性例程200的流程图,示例性例程200用于被个性化并且因此根据观点和/或内容源被多样化的搜索结果对搜索查询进行响应。从框202开始,搜索引擎122从计算机用户接收搜索查询102。在框204处,搜索引擎标识满足搜索查询的搜索结果。

在框206,获得请求计算机用户的多样化偏好,并且在框208,根据用户的偏好使搜索结果多样化。如上所述,多样化意味着与所标识的搜索结果相关联的得分根据用户的偏好被重新排序和/或修改。例如,如果计算机用户已经指示他/她只想查看具有积极观点的用户生成内容的那些结果,则对应于具有积极观点的用户生成内容的那些标识的搜索结果的对应得分增加,并且具有中性和/或消极观点的那些已标识的搜索结果减少。

当然,根据所公开的主题的各个方面,除了简单地表达关于观点的单个偏好(例如,积极或消极或中立)之外,计算机用户可以提供用户可能希望看到的观点的比率。例如(作为说明而非限制),计算机用户可以建立偏好,使得50%的搜索结果表示积极的观点,搜索结果中的30%表示消极情绪,并且搜索结果中的20%表示中立情绪。搜索结果表达了中立的情绪。当然,通过进一步说明,用户可以进一步建立关于内容源的类似偏好:(用户生成的内容的)所有搜索结果是从非商业内容源获得的,或搜索结果中的40%是从非商业内容源获得的。此外,观点和内容源的组合可以被应用于搜索结果,所有这些都根据用户提供的多样化准则(即,关于特定搜索查询明确识别或在由搜索引擎维护的用户偏好中建立的用户偏好)使搜索结果多样化。根据所公开的主题的各方面,附加和/或替代的多样化的可以是基于根据内容项的流行度。在这方面,计算机用户可以请求:在首先呈现给计算机用户的那些搜索结果中,不太流行的搜索结果(其在第一搜索结果集合中不太可能被呈现给计算机用户)被显露给用户。实际上,用户可以指示搜索结果中的20%应被视为不太受欢迎的搜索结果。当然,观点、内容源和流行度仅是各种多样化的示例,该各种多样化可以可用于计算机用户以响应于搜索查询来使搜索结果多样化。此外,虽然多样化被描述为可应用于用户生成的内容,但是应当理解,可以针对所有内容进行这些相同的多样化。此外,用户生成可以被视为多样化,即,除了商业源内容之外,用户可以表示对搜索查询的至少20%的搜索结果是对用户生成的内容的引用。

在使搜索结果多样化之后,在框210,根据重新排序的、多样化的搜索结果生成一个或多个搜索结果页面。如上所述,具有最高得分的那些搜索结果被包括在第一搜索结果页面的第一搜索结果集合中。在框212处,一个或多个搜索结果页面被返回给请求计算机用户。此后,例程200终止。

关于上述例程200,以及本文描述的其他过程(诸如过程100),虽然这些例程/处理是关于离散步骤被表达,但是这些步骤应当被视为本质上是逻辑性的并且可以或可以不对应于给定实现的任意特定实际和/或离散步骤。此外,除非另有说明,否则这些步骤在各种例程和过程中呈现的顺序不应被解释为可以执行这些步骤的唯一顺序。而且,在某些情况下,这些步骤中的一些可以被省略。本领域技术人员将认识到,步骤的逻辑表示对于执行所要求保护的主题的各方面是充分有益的,而与逻辑指令/步骤被编码的任意特定开发语言无关。

当然,虽然这些例程包括所公开主题的各种新颖特征,但是其他步骤(未列出)也可以在这些例程中阐述的主题的执行时被执行。本领域技术人员将理解,这些例程的逻辑步骤可以组合在一起或者由多个步骤组成。上述例程的步骤可以并行或串行执行。通常但非排他地,各种例程的功能体现在诸如关于如下图6所描述的计算设备的计算设备的一个或多个处理器上执行的软件(例如,应用、系统服务、库等)中。另外,在各种实施例中,各种例程中的全部或一些也可以被实施在可执行硬件模块中,包括但不限于在系统计算机上的片上系统(soc)、编解码器、专门设计的处理器和/或逻辑电路等。

如上所述,这些例程/过程通常体被实施在可执行代码模块中,该可执行代码模块包括例程、函数、循环结构、诸如if-then和if-then-else语句的选择器、赋值、算术计算等。然而,如上所述,每个例程的可执行语句中的准确实现基于各种实现配置和决策,包括编程语言、编译器、目标处理器、操作环境以及链接或绑定操作。本领域技术人员将容易理解,在这些例程中标识的逻辑步骤可以以任意数目的方式实现,因此,上面阐述的逻辑描述足以使得能够实现类似的结果。

虽然所公开的主题的许多新颖方面在应用(也称为计算机程序)、app(小的、通常是单一或狭窄用途的应用)和/或方法中实施的例程中表达,但是这些方面也可以被实施为由计算机可读介质存储的计算机可执行指令,也称为计算机可读存储介质,其是制品。如本领域技术人员将认识到的,计算机可读介质可以托管、存储和/或再现计算机可执行指令和数据以供稍后取回和/或执行。当托管或存储在计算机可读存储设备上的计算机可执行指令由计算设备的处理器执行时,其执行引起、配置和/或适配执行计算设备以执行各种步骤、方法和/或功能,包括上面关于各种所图示例程描述的那些步骤、方法和例程。计算机可读介质的示例包括但不限于:光学存储介质,诸如蓝光盘、数字视频盘(dvd)、光盘(cd)、光盘盒等;磁存储介质,包括硬盘驱动器、软盘、磁带等;存储器存储设备,诸如随机存取存储器(ram)、只读存储器(rom)、存储器卡、拇指驱动器等;云存储装置(即在线存储服务);等等。虽然计算机可读介质可以再现和/或导致经由包括载波和/或传播信号的各种传输部件和介质将计算机可执行指令和数据传送到计算设备以由一个或多个处理器来执行,但是出于本公开的目的,计算机可读介质明确地排除载波和/或传播信号。

转到图3,图3是图示了根据所公开主题的各方面的、编码有用于配置/操作作为搜索引擎的指令的示例性计算机可读介质的框图。更具体地,实现300包括计算机可读介质308(例如,cd-r、dvd-r或硬盘驱动器的盘片),在其上编码计算机可读数据306。该计算机可读数据306进而包括计算机指令集合304,其被配置为根据本文阐述的一个或多个原理进行操作。在一个这样的实施例302中,处理器可执行指令304可以被配置为执行方法,诸如例如图2的示例性方法200中的至少一些。在另一这样的实施例中,处理器可执行指令304可以被配置为实现系统,诸如图4的示例性系统400中的至少一些,如下所述。本领域普通技术人员可以设计许多这样的计算机可读介质,其被配置为根据本文呈现的技术进行操作。

转到图4,图4是图示了根据所公开主题的各方面的被配置为搜索引擎的示例性计算设备122的框图。示例性计算设备122包括一个或多个处理器(或处理单元),诸如处理器402和存储器404。处理器402和存储器404以及其他组件通过系统总线410互连。存储器404通常(但不总是)包括易失性存储器406和非易失性存储器408两者。易失性存储器406只要存储器被供电,就保留或存储信息。相反,非易失性存储器408即使在电源不可用时也能够存储(或保持)信息。一般而言,ram和cpu缓存存储器是易失性存储器406的示例,而rom、固态存储器设备、存储器存储设备和/或存储卡是非易失性存储器408的示例。

处理器402执行从存储器404(和/或从计算机可读介质,诸如图3的计算机可读介质300)取回的指令,以执行被配置为如上所述的多样化搜索结果的搜索引擎的各种功能。处理器402可以包括许多可用处理器中的任意一个,诸如单处理器、多处理器、单核单元和多核单元。

此外,所图示计算设备122包括网络通信组件412,用于通过计算机网络将该计算设备与其他设备和/或服务互连,包括其他用户设备,诸如如图5中所示的用户计算设备502-506,以及社交网络514和用户博客站点512。网络通信组件412(有时称为网络接口卡或nic)经由物理/有形(例如,有线、光学等)连接、无线连接或两者使用一个或多个通信协议通过网络(诸如网络508)进行通信。如本领域技术人员将容易理解的,诸如网络通信组件412的网络通信组件通常包括硬件和/或固件组件(并且还可以包括或包含可执行软件组件),其通过传输介质(即网络)发送和接收数字和/或模拟信号。

计算设备122还包括i/o子系统414。可以理解,i/o子系统包括硬件、软件和/或固件组件的集合,其能够实现或促进计算设备122的用户和计算设备122的处理系统之间的相互通信。实际上,经由i/o子系统414,计算机操作员可以经由一个或多个输入通道(例如,通过说明而非限制,触摸屏/触觉输入设备、按钮、指示设备、音频输入、光学输入、加速度计等)提供输入。信息的输出或呈现可以通过显示屏(可以是或可以不是触敏的)、扬声器、触觉反馈等中的一个或多个来进行。如将容易理解的,计算机操作员和计算设备122之间的交互是经由计算设备的i/o子系统414能够实现的。

计算设备122还包括搜索查询模块420。搜索查询模块420是可执行模块,其被配置(执行中)以从计算机用户接收搜索查询,诸如搜索查询102,响应给定的搜索查询来获得搜索结果页面,并将一个或多个搜索结果页面返回给请求的计算机用户。在操作/执行中,搜索查询模块420结合示例性计算设备122的其他组件进行操作,示例性计算设备122的其他组件包括搜索结果标识模块422、搜索结果多样化模块424、内容分类器426和搜索结果页面生成器428,如下面所描述的。

搜索结果标识模块422在执行中操作以响应于来自计算机用户的搜索查询根据内容存储库432中的信息来标识搜索结果。实际上,搜索结果标识模块422标识满足搜索查询的有序搜索结果的集合,其中每个搜索结果与指示搜索结果与搜索查询的相关性和/或流行度的得分相关联。根据所公开主题的各个方面,内容存储库432是对内容的引用的索引存储库,其包括与指示用户提供的多样化准则/偏好的内容项(诸如,通过说明而非限制,观点、内容源、以及内容是否是用户生成的内容)相关联的多样化密钥。实际上,根据各种实施例,内容存储库432是反向索引内容存储库。反向索引内容存储库和索引内容存储库在本领域中是已知的。当然,虽然多样化密钥可以预先与内容存储库432中表示的各种内容项相关联,但是在各种实施例中,内容分类器426可以按需/即时方式执行,以确定例如可以在标识的搜索结果中被呈现的给定内容项的各种多样化属性。

搜索结果多样化模块424在执行中操作以根据由请求计算机用户提供的和/或包括在用户偏好存储库434中的用户提供的多样化准则/用户偏好来修改(或重新排序)由搜索结果标识模块422标识的一个或多个搜索结果的得分。这些用户提供的多样化准则/用户偏好包括多样化属性,例如观点、内容源和用户生成的内容。搜索结果多样化模块424的结果是有序搜索结果的更新集合,其根据基于用户提供的多样化准则/用户偏好修改的得分进行更新。

如已经建议的,内容分类器426操作以识别多样化属性,包括内容观点、内容源和用户生成的内容。内容分类器426可以以批处理模式操作以处理多个内容项并且将多样化属性与内容项相关联地或者以即时/按需方式存储在内容索引中。

搜索结果页面生成器428在执行中操作用于根据提供给它的有序搜索结果集合来生成一个或多个搜索结果页面。根据所公开的主题的各方面,该有序搜索结果集合包括搜索结果,其得分由搜索结果多样化模块422修改。搜索结果页面被提供给搜索查询模块420,搜索查询模块420用生成的搜索结果页面中的一个或多个对请求计算机用户进行响应。

现在转向图5,图5是图示了适合于实现所公开主题的各方面的示例性网络环境500的框图。网络环境500包括用户计算机502-506,每个用户计算机对应于计算机用户(例如,计算机用户101)。如上所述,诸如计算机用户501的计算机用户通过诸如用户计算机502的用户计算机通过网络508向搜索引擎122提交搜索查询102,并响应于查询来接收一个或多个搜索结果页面。网络环境500还包括其他网络设备和/或服务,诸如(作为说明而非限制)社交网络站点514和个人博客站点512。如本领域技术人员将容易理解的,搜索引擎122(通过包括网络爬虫的各种技术)标识位于网络上的内容项,包括诸如用户块516的用户生成的内容,对内容项进行索引,并将信息存储在内容存储库432中。

虽然已经描述了所公开主题的各种新颖方面,但是应当理解,这些方面是示例性的,并且不应当被解释为限制。在不脱离所公开主题的范围的情况下,可以对各个方面进行变化和改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1