基于与搜索结果中的一个或多个相关联的消除动作修改搜索结果的制作方法_2

文档序号:9916585阅读:来源:国知局
里所描述的系统、组件和技术可以与之对接的信息检索系统的示例。
[0047]用户可以经由客户端设备106与搜索系统102进行交互。搜索系统102从客户端设备106接收搜索查询104并且响应于该搜索查询104返回搜索结果108。每个搜索查询104是针对信息的请求。搜索查询104例如可以为文本形式和/或其它形式,例如,诸如是音频形式和/或图像形式。其它计算机设备可以向搜索系统102提交搜索查询,上述搜索系统102诸如另外的客户端设备和/或一个或多个服务器,上述服务器为已经与搜索系统102的提供方合作的网站实施服务。然而,为了简洁起见,在客户端设备106的背景下描述示例。
[0048]客户端设备106可以是通过诸如局域网(LAN)或诸如互联网的广域网(WAN)的网络而耦接至搜索系统102的计算机。客户端设备106例如可以是台式计算设备、膝上计算设备、平板计算设备、移动电话计算设备、用户车辆的计算设备(例如,车载通信系统、车载娱乐系统、车载导航系统)、或者用户的包括计算设备的可穿戴装置(例如,用户的具有计算设备的手表、用户的具有计算设备的眼镜)。可以提供另外和/或可替换的客户端设备。客户端设备106通常包括一个或多个应用以促成搜索查询的提交以及通过网络发送并接收数据。例如,客户端设备106可以执行诸如浏览器107的一个或多个应用,后者允许用户构建查询并且向搜索系统102提交该查询。
[0049]如这里所讨论的,在一些实施方式中,客户端设备106可以执行诸如浏览器107的一个或多个应用,后者执行搜索系统102所提供的指令以基于与搜索结果中的一个或多个相关联的消除动作而修改搜索结果。客户端设备106和搜索系统102均包括用于存储数据和软件应用的存储器、用于访问数据并执行应用的处理器、以及促成网络上的通信的组件。客户端设备106和/或搜索系统102所执行的操作可以跨多个计算机系统分布。搜索系统102例如可以被实施为在一个或多个位置通过网络互相耦接的一个或多个计算机上运行的计算机程序。
[0050]搜索系统102包括索引引擎120和排名引擎110。索引引擎120保存索引125以便由搜索系统102使用。索引引擎120例如使用常规和/或其它索引技术而对文档进行处理并且更新索引125中的索引条目。例如,索引引擎120可以爬取诸如万维网的一个或多个资源并且对经由这样的爬取所访问的文档进行索引。而且,例如,索引引擎120可以从诸如web管理者的一个或多个资源接收有关一个或多个文档的信息,上述web管理者基于这样的信息对这样的文档进行控制并对文档进行索引。文档是与文档地址相关联的任意数据。举出几个示例,文档包括网页、文字处理文档、便携式文档格式(PDF)文档、图像、视频和馈送资源。例如,每个文档可以包括内容,诸如:文本、图像、视频、声音、嵌入式信息(例如,元信息和/或超链接);和/或嵌入式指令(例如,诸如JavaScript的ECMAScript实施方式)。
[0051]在一些实施方式中,索引125可以包括将一个或多个文档中的每一个与关联于该文档的相应的一个或多个条目进行关联的索引条目。例如,针对多个文档中的每一个,可以在索引125中识别该文档与关联于该文档的一个或多个条目的映射(例如,定义关联的数据)。在一些实施方式中,文档和相关联条目的索引可以在索引或者与索引125分离的其它数据库中提供。在一些实施方式中,条目是论述的题目。在一些实施方式中,实体是能够被文本片段(例如,术语或短语)所指代并且能够互相区分开来(例如,基于上下文)的人、地方、概念和/或事物。例如,网页上的文本“bush”可能是指多个实体,诸如George HerbertWalker Bush总统、George Walker Bush总统、灌木丛以及Bush摇滚乐队。在一些实施方式中,实体可以被唯一的实体标识符所引用,后者可以被用来识别该实体。在该说明书中的一些示例中,实体可以关于唯一实体标识符而被引用。在一些其它示例中,实体可以关于该实体的一个或多个别名和/或其它属性而被引用。
[0052]在一些实施方式中,文档可以仅被映射至单个实体。例如,文档可以仅关注于单个实体和/或单个实体可以被确定为针对该文档比一个或多个其它实体更为重要。在一些实施方式中,一个文档可以被映射至多个实体。在那些实施方式的一些中,分数可以与多个实体相关联并且该分数可以指示实体与文档的关联的强度。例如,从O至I的分数可以与每个实体相关联,其中I以最大程度指示实体与文档的关联。例如,冰球队匹兹堡企鹅队的网页可以与多个实体相关联,诸如与冰球队匹兹堡企鹅队相关联的实体以及与冰球运动相关联的实体。分数例如可以基于所确定的每个实体与文档的关联强度而与这两个实体中的每一个相关联。
[0053]在一些实施方式中,文档和实体之间的关联可以由实体集群模块112在针对查询确定一个或多个搜索结果集合时进行访问,和/或由指令模块114在基于与搜索结果中的一个相关联的消除动作而确定用以修改搜索结果的指令时进行访问。在一些实施方式中,文档和实体之间的关联可以基于该实体的一个或多个属性在文档中的出现。例如,文档和实体之间的关联可以基于该实体的一个或多个别名在该文档中的重要性。例如,该实体的别名在重要字段中的出现和/或在文档中具有高频率可以指示实体与文档的关联。而且,例如,文档和实体之间的关联可以基于实体的另外和/或可替换的属性的出现,诸如出生日期、出生地、身高、体重、人口、地理位置、实体类型(例如,人、演员、位置、工作、大学)等。
[0054]在一些实施方式中,文档和实体之间的关联可以基于有关该实体的一个或多个其它实体在该文档中的存在。例如,实体之间的链接可以从诸如实体属性数据库之类的数据库进行识别。例如,实体属性数据库可以包括实体的配偶信息并且文档和人之间的关联可以基于这个人的配偶在该文档中的出现。例如,如果一个人的别名是模糊的,则与这个人的别名出现在该文档中而其配偶的别名并未出现的情况相比,这个人的配偶的别名连同这个人的别名一起存在在文档中可以以更大程度指示这个人与该文档相关联。而且,例如,文档与实体之间的关联可以基于与给定实体相关联的另外和/或可替换的实体的存在,诸如同事、共同出演者、相似类型的工作,等等。在将文档与一个或多个实体相关联时可以利用另外和/或可替换的因素。
[0055]在该说明书中,术语“数据库”和“索引”将宽泛地被用来指代数据的任意集合。该数据库和/或索引的数据并不需要以任何特定方式进行构造并且其能够存储在处于一个或多个地理位置的存储设备上。因此,例如,索引125可以包括多个数据集合,其中的每一个可以以不同方式进行组织和访问。例如,索引实体的第一集合可以被用来识别对搜索查询104进行响应的文档,并且索引实体的第二集合可以被用来识别有关响应文档的附加信息,例如,上述信息诸如与响应文档相关联的一个或多个实体。
[0056]排名引擎110使用索引125来识别对搜索查询104进行响应的文档,例如使用常规的和/或其它的信息检索技术。排名引擎110例如使用一个或多个排名信号而针对被识别为对搜索查询104进行响应的文档计算分数。每个排名信号提供有关文档自身和/或文档和搜索查询104之间的关系的信息。
[0057]在一些实施方式中,排名信号可以包括有关搜索查询104自身的信息,例如,该信息诸如该查询的项、提交该查询的用户的标识符、和/或提交该查询的用户的类别(例如,提交该查询的地理位置、提交该查询的用户的语言、提交该查询的用户的兴趣、和/或被用来提交该查询的客户端设备106的类型(例如,移动设备、膝上电脑、台式机等))。用户的识别例如可以是客户端设备106的用户名或IP地址。提交搜索查询104的地理位置例如可以是大洲、国家、州、城市、或者诸如经玮度的地理坐标。
[0058]而且,例如,排名信号可以另外和/或可替换地包括有关搜索查询104的术语的信息,例如,该信息诸如查询项在文档中锚点(anchor)的标题、主体和文本中出现的位置,查询项在指向搜索结果的锚点中出现的位置,项在文档中如何使用(例如,在文档的标题中,在文档的主体中或者在文档中的链接中),项频率(即,该项在与查询相同的语言的文档的语料库中出现的次数除以在语料库中的该术语的总数),和/或文档频率(即,文档的语料库中包含该查询项的文档的数量除以在该语料库中的文档的总数)。
[0059]而且,例如,排名信号可以另外和/或可替换地包括有关文档的信息,例如,该信息诸如文档的质量量度、文档的流行性量度、文档的URL、托管文档的地理位置、搜索系统102何时首次将文档添加至索引125、文档的语言、文档标题的长度和/或指向文档的链接的源锚点的文本长度。
[0060]排名引擎110随后使用该分数对响应文档进行排名。例如,响应文档基于分数进行排名。搜索系统102使用排名引擎110所排名的响应文档生成搜索结果108。搜索结果108包括对应于对搜索查询104进行响应的文档的搜索结果。例如,一个或多个搜索结果108中的每一个可以包括相应文档的标题、指向相应文档的链接和/或来自对搜索查询104进行响应的相应文档的内容概要。例如,内容概要可以包括对搜索查询104进行响应的文档的特定“片段”或部分。而且,例如,对于与图像文档相关联的搜索结果而言,该搜索结果可以包括该图像文档的尺寸有所减小的显示、与该图像文档相关联的标题和/或指向该图像文档的链接。而且,例如,对于与视频文档相关联的搜索结果而言,该搜索结果可以包括来自该视频的图像、该视频的分段、该视频的标题和/或指向该视频的链接。搜索结果108的其它示例包括对搜索查询104进行响应的信息概要和/或对搜索查询104进行响应的答案。该概要可以从对搜索查询104进行响应的文档和/或其它来源所生成。
[0061]搜索结果108以可以向用户进行呈现的形式被传送至客户端设备106。例如,搜索结果108可以作为经由在客户端设备106上执行的浏览器107进行显示的搜索结果网页而被传送和/或作为经由音频传递给用户的一个或多个搜索结果而被传送。图5A-6D给出了搜索结果网页的示例并且在这里更为详细地进行描述。搜索结果108可以基于相对应的搜索结果文档的排名而被呈现给用户。例如,当搜索结果108作为搜索结果网页进行呈现时,搜索结果108可以基于相对应的搜索结果文档的排名进行显示。例如,最为显著地进行显示的搜索结果可以是排名最高的搜索结果,下一个最为显著地进行显示的搜索结果可以是排名第二高的搜索结果,等等。在一些实施方式中,搜索结果108的呈现可以包括搜索查询的所有搜索结果的子集。例如,初始搜索结果网页可以包括排名前X的搜索结果108并且可以包括观看另外的搜索结果网页的链接,上述另外的搜索结果网页均包括比排名前X的搜索结果排名更低的另外的搜索结果。因此,在一些实施方式中,被传送至客户端设备106并且响应于与搜索结果108中的一个或多个相关联的消除动作而被修改的搜索结果108可以仅是对搜索查询104进行响应的所有搜索结果的子集。
[0062]如这里所描述的,在一些实施方式中,搜索结果108可以与识别搜索结果108所属的一个或多个搜索结果集合的搜索结果集合信息和/或与基于与搜索结果108中的一个或多个相关联的消除动作而修改搜索结果的显示的指令一起向客户端设备106提供。例如,搜索结果108可以作为网页来提供,该网页包括HTML代码以及该HTML代码中所映射的内容。该HTML代码自身和/或该HTML代码中所映射的内容可以包括针对每个搜索结果识别该搜索结果所属的一个或多个搜索结果集合的搜索结果信息。该HTML代码中所映射的内容另外和/或可替换地可以包括指令,诸如客户端侧脚本实施方式的指令,诸如ECMAScript,其可以被客户端设备106所访问并且整体或部分被客户端设备106所执行以修改搜索结果108。例如,该指令可以作为在搜索结果网页中映射的JavaScript指令被提供,并且浏览器107可以执行该JavaScript指令以基于与搜索结果108中的一个或多个相关联的消除动作而修改搜索结果108的显示。例如,该指令可以包括用以以下的指令:确定与搜索结果相关联的消除动作、识别与被消除的搜索结果相关联的一个或多个搜索结果集合、以及修改搜索结果的显示以降级与关联于被消除的搜索结果的一个或多个搜索结果集合相关联的任意搜索结果。例如,搜索结果的显示可以通过经由在浏览器107中对搜索结果网页的操控而改变与关联于被消除的搜索结果的一个或多个搜索结果集合相关联的任意搜索结果的呈现参数而得以被修改。例如,任何这样的搜索结果的暗淡程度可以经由在浏览器107中对搜索结果网页的操控而有所增加。
[0063]在一些实施方式中,用以基于与搜索结果108中的一个或多个相关联的消除动作而修改搜索结果108的指令可以整体或部分被搜索系统102所执行。例如,经由客户端设备106所进行的用户消除动作的指示可以向搜索系统102提供,并且该搜索系统102可以执行该指令以修改搜索结果并且向客户端设备106提供经修改的搜索结果。例如,经修改的搜索结果可以作为新的搜索结果网页向客户端设备106提供,和/或可以经由在客户端设备106上执行的脚本而向客户端设备106传输,以使得客户端设备106能够更新搜索结果网页以包括经修改的搜索结果。
[0064]排名引擎110包括实体集群模块112和指令模块114
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1