使用声誉度量来提高搜索相关度的制作方法

文档序号:6479029阅读:191来源:国知局
专利名称:使用声誉度量来提高搜索相关度的制作方法
技术领域
本发明涉及数据检索。具体地但并非限制性地,本发明公开了用于对在计算机搜 索中定位的项目的相关度(relevancy)记分的技术。
背景技术
计算机现在被用于存储大量信息。为了定位感兴趣的特定信息,已经创建出了强 大且直观的搜索机制。例如,因特网的万维网部分从二十世纪八十年代末期其首次被引入以来已经获得 了指数增长。在万维网的历史的早期,网站的目录被用于引导用户到感兴趣的网站。最著 名的早期网站目录之一是“Jerry' s Guide to thefforld Wide Web”,其后来被重命名为 "Yahoo ! ”。然而,因特网的快速实时增长迅速使得万维网目录不可管理且易于过时。诸如 Lycos.AltaVista和Google之类的因特网搜索引擎成为了在因特网上找到网站的新方法。 因特网搜索引擎使得用户可以输入与感兴趣的主题有关的几个关键字并且返回包含用户 输入的这些关键字的一大组搜索结果。因特网搜索引擎通过在万维网上“爬行”以获知新网页并随后创建访问过的所有 网页的可搜索索引来工作。当用户输入一组关键字时,搜索引擎返回包含着用户输入的关 键字的一组网页。然而,搜索引擎用户输入的查询大多会映射到包含匹配关键字的数千个 甚至数十万个结果。这种信息负荷不是用户希望的。从而,构建一个很好的搜索引擎的真 正关键在于按某种类型的相关度度量来整理结果。这样,互联网搜索引擎的用户可以迅速 找到期望的内容。


在不一定按比例绘制的附图中,相似的数字在几幅图中始终描述基本类似的组 件。具有不同字母后缀的相似数字表示基本类似的组件的不同实例。附图以示例而非限制 方式概括地图示了本文献中论述的各种实施例。图1示出了采取计算机系统的示例性形式的机器的图示,在该机器内可以执行用 于使得该机器执行这里论述的方法中的任何一个或多个的一组指令。图2示出了描述一个实施例如何响应于用户选择而修改相关度调整因子的高层 流程图。图3示出了可用于本发明的各种实施例中的一些数据库表。图4示出了描述在图2的系统中创建的相关度调整因子如何可用于为搜索结果集中的项目调整相关度得分的高层流程图。图5示出了图2中公开的相关度调整因子系统,其中添加了防止点击其自己项目 的激进用户进行的滥用的步骤。图6示出了图5的相关度得分调整系统,其中与每个用户相关联的声誉得分被用 于进行与该声誉得分相联系的调整。
具体实施方式

以下详细描述参考了附图,附图形成了详细描述的一部分。附图根据示例性实施 例示出了图示。这些实施例在这里也被称为“示例”,它们被足够详细地描述以使得本领域 的技术人员能够实现本发明。对于本领域的技术人员来说将会很明显的是,实现本发明并 不必需示例性实施例中的具体细节。虽然示例性实施例主要是参考互联网市场系统来公开 的,但是教导也可用于其他类型的结合搜索引擎的系统。例如,社交网络网站或媒体呈现网 站可结合本发明的教导。可以组合示例性实施例,可以利用其他实施例,或者可以进行结 构、逻辑和电气变化,而不脱离所要求保护的范围。以下详细描述因此不应当被理解为限制 性的,并且范围由所附权利要求及其等同物来限定。在本文献中,正如专利文献中常见的,术语“一”被用于包括一个或多个。在本文献 中,术语“或”用于指非排他性的或,例如“A或B”包括“有A但没有B”、“有B但没有A”以 及“A和B”,除非另有指明。另外,本文献中引用的所有公布、专利和专利文献在这里通过引 用被完全结合进来,就好像分别通过引用结合进来一样。在本文献和通过引用这样结合进 来的那些文档之间存在不一致的用法的情况下,所结合的(一个或多个)参考文献中的用 法应当被认为是本文献中的用法的补充;对于不可调和的不一致,以本文献中的用法为准。计算机系统图1示出了采取计算机系统100的示例性形式的机器的图示,在该机器内可以执 行用于使得该机器执行这里论述的方法中的任何一个或多个的一组指令124。在替换实施 例中,该机器可以作为独立的设备操作或者可以连接到(例如联网到)其他机器。在联网部 署中,该机器在服务器_客户端网络环境中可以作为服务器或客户端机器,或者在对等(或 分布式)网络环境中可以作为对等体机器。该机器可以是个人计算机(PC)、平板PC、机顶 盒(STB)、个人数字助理(PDA)、蜂窝电话、web用具、网络服务器、网络路由器、网络交换机、 网桥或者能够执行规定该机器应采取的动作的一组指令(顺序的或者其他形式的)的任何 机器。另外,虽然在图1中只示出单个机器,但是术语“机器”应当也被理解为包括单独或 联合执行一组(或多组)指令以执行这里论述的方法中的任何一个或多个的机器的任何集
I=I O图1所示的示例性计算机系统100包括处理器102 (例如,中央处理单元(CPU)、 图形处理单元(GPU)或两者)、主存储器104、静态存储器106,它们可经由总线108相互通 信。计算机系统100还可包括视频显示适配器110,其驱动诸如液晶显示器(LCD)或阴极 射线管(CRT)之类的视频显示系统115。示例性计算机系统100还包括字母数字输入设备 112 (例如,键盘)、光标控制设备114(例如,鼠标或轨迹球)、盘驱动单元116、信号生成设 备118(例如,扬声器)以及网络接口设备120。注意,计算机系统的各种实施例不会始终包 括所有这些外围设备。
盘驱动单元116包括机器可读介质122,其上存储着体现这里描述的方法或功能 中的任何一个或多个或者被其所利用的一组或多组计算机指令和数据结构(例如,也称为 “软件”的指令124)。指令124在其被计算机系统100执行期间可以完全或至少部分地驻 留在主存储器104内和/或处理器102内,主存储器104和处理器102也构成机器可读介
质。 用于操作计算机系统100的指令124可以利用若干种公知的传输协议(例如,文 件传输协议(FTP))中的任何一种经由网络接口设备120通过网络126被发送或接收。虽然机器可读介质122在示例性实施例中被示为单个介质,但是术语“机器可读 介质”应当被理解为包括存储一组或多组指令的单个介质或多个介质(例如,集中式或分布 式数据库,和/或相关联的缓存和服务器)。术语“机器可读介质”还应被理解为包括能够 存储、编码或携带一组指令以供机器执行并且使得机器执行这里描述的方法中的任何一种 或多种的任何介质,或者能够存储、编码或携带被这样一组指令利用或者与这样一组指令 相关联的数据结构的任何介质。术语“机器可读介质”因此应当被理解为包括但不限于固 态存储器、光介质、闪存、磁介质和载波信号。对于本说明而言,术语“模块”包括用于实现特定功能、操作、处理或过程的计算机 代码、计算或可执行指令、数据或计算对象的可识别部分。模块不是必须用软件来实现;模 块可以用软件、硬件/电路或软件和硬件的组合来实现。捭索引擎搜索引擎是被设计为使计算机用户可以搜索特定信息域的计算机程序。搜索引擎 通常使得计算机用户可以输入一组搜索关键字,随后搜索引擎生成来自搜索域的包含用户 指定的关键字的一组搜索结果。搜索引擎的非常流行的形式是在全球因特网上可获得的万维网搜索引擎。万维网 搜索引擎使得web用户可以输入一组搜索关键字,然后万维网搜索引擎返回包含用户指定 的搜索关键字的搜索结果集,万维网页面。万维网搜索引擎通常是通过以下方式来操作的令获知新网页的自动化程序(通 常称为“web爬虫”)访问万维网页以不断地获知在万维网上可得的内容。由自动化web爬 虫程序获得的信息被用于创建该自动化web爬虫程序曾访问过的所有网页的可搜索索引。 该可搜索索引被因特网搜索引擎用于为来自因特网用户的搜索请求生成搜索结果。^nmmmm^m^当用户向搜索引擎中输入一组关键字时,搜索引擎返回包含用户输入的关键字的 一组结果。对于因特网用户输入到因特网搜索引擎中的大多数查询,所输入的关键字通常 会匹配数千甚至数十万个网站。只是简单地返回具有数十万个网站的这样一大组结果的搜 索引擎就不是非常有用。过量信息不是只不过希望定位出具有关于被输入到搜索引擎中的关键字的信息 的良好网站的互联网用户所希望的。因特网用户更宁愿获得与因特网用户真正感兴趣的东 西高度相关的良好搜索结果。从而,构建良好的搜索引擎的真正关键在于按某种类型的相 关度度量对搜索结果记分,并且在搜索结果列表的顶部呈现被认为最相关的结果。从而,相 关度系统的目标是推断出请求因特网搜索的因特网用户的真实意图,以便识别出最佳地满 足用户意图的结果。
许多因特网搜索引擎已经实现了各种版本的这种相关度记分系统,以便改善由这 些因特网搜索引擎提供的搜索结果的质量。在一种用于万维网站的公知的相关度确定系统 中,每个网站被赋予一相关度得分,该相关度得分取决于指向该网站的外部超链接的数目。 从而,指向特定网站的其他网站越多,就认为该特定网站越相关。实际上,去到一网站的每 个超链接充当在相关度记分系统中对该网站的流行度“投票”。收到最多的这种投票的匹配 网站将被放置在搜索结果的顶部或顶部附近。
这种相关度系统的一个缺点在于一旦用于计算相关度得分的系统被广泛知晓,该 相关度系统就成为了希望人为地提升其网站的能见度的人的滥用对象。例如,如果特定的 商业网站希望为其网站生成大量流量,则该网站可以创建链接到主商业网站的许多外部网 站。这样,就可以欺骗因特网搜索引擎的相关度记分系统将该商业站点排名得较高,虽然是 同一个实体创建了去到该主网站的所有这多个链接。动杰数据集的相关度如前一部分中所述,用于确定一数据集中的项目的相关度的一种可能的方法是使 用关于该数据集内的项目的相对流行度的某种已知指标。在搜索因特网网站的上下文内, 特定网站的相对流行度可以从有多少其他网站链接到该特定网站来推断出。从而,去到特 定网站的链接的数目可用作因特网搜索引擎内的相关度得分的一部分。然而,在域中项目随时都在变化的非常动态的数据域中,对流行度的这种相对静 态的指示对于确定相关度并不很有用。例如,在不断呈现可供销售的新项目的在线市场中, 搜索域中的项目(当前可供销售的项目)的集合随着项目被销售和新项目被许诺销售而不 断变化。从而,可供销售的项目代表“动态数据域”。去到与供销售的项目相关联的网页的 任何链接是相对无用的,因为在向与供销售的项目相关联的网页做出许多链接之前,项目 通常已经被售出了。从而,需要其他方法来为动态数据域创建相关度得分。由于动态数据域中的项目不断变化着,所以直接连接到动态域中的特定项目的任 何信息(例如去到当前在数据域中的项目的网页的链接)对于一般确定相关度是没有用 的,因为该特定项目可能很快就不见了。取而代之,描述数据域中的特定流行项目(并从而 可用于描述其他类似项目)的因素对于相关度是有用的。另外,由于目标是确定搜索动态数据域的用户的意图,所以相关度的任何度量在 理想情况下都将与该用户做出的实际搜索请求相联系。为了达成这些目标,已经设计了一 种系统,其基于在已响应于用户的搜索请求而向用户呈现了一组搜索结果项目之后做出的 用户项目选择来生成相关度排名。在所公开的动态数据域相关度系统中,系统利用满足用户的搜索请求的要求的一 组项目来对用户搜索请求做出响应。这些项目随后通常会以附加信息有限的列表形式来显 示。用户随后可选择在搜索结果中呈现的任何项目,以获得关于该所选项目的更多信息。用 户对搜索结果中的项目的这种选择充当了在用户的原始搜索的上下文内对该特定项目的 流行度投票。注意,为了对将来的相关度确定有用,必须从用户的选择中抽象出所选项目的 一些描述性因素,以便将该描述性因素用于将来的相关度确定。这样,当必须对同一搜索请 求执行相关度确定,但该所选项目已不存在时,利用从所选项目抽象出的描述性因素,可在 识别出动态数据域中具有高相关度的类似项目。在一个实施例中,将来可用于识别类似相关项目的描述性因素是项目的描述性字段中的附加字词,这些附加字词不是用户的原始搜索查询关键字的一部分。从而,如果用户 输入特定的搜索查询,并随后选择了均包含具有不在原始搜索查询中的特定字词的描述字 段的一组项目,则具有该特定字词将提升项目针对该特定搜索查询的相关度。类似地,如果 查询结果中的一组项目都共享特定的字词,但是这些项目都没有被用户选择,则具有该特 定字词可减小项目针对该搜索查询的相关度得分。注意,也可使用其他因素,并且这只是可 用于在将来识别类似项目的描述性因素的一个示例。 例如,希望购买便携式数字音乐播放器的用户可以在在线市场的搜索引擎中输入 搜索查询“ipod nano”。响应于对在线市场的“ipod nano”搜索查询,系统可以呈现具有在 左列列出的描述字段的项目。中间列包含在去除原始搜索查询(“ipod nano")和常见虚 字(and、or、in、the、for等等)之后来自描述字段的各种字词。表1 :“ipod nano”搜索查询的可能搜索查询结果 有兴趣购买新的iPod Nano设备的用户可能点击“sealed 4Gb IpodNano”、“iPod Nano sealed,,、以及"New ipod Nano 8GB black” 以及 “new 4GB white ipod nano,,的条 目。从而,在将来对“ipod nano”的搜索中,包括曾被用户选择的额外词语的项目应当收到 增大的相关度得分。执行这个的一种方法是向每个可能的额外字词赋予一相关度调整因 子。与额外字词相关联的该相关度调整因子将调整具有带该额外字词的描述的项目的相 关度得分。当用户选择一项目时,与该所选项目相关联的额外字词的相关度调整因子将被 增大。从而,与所选的四个项目相关联的额外词语(sealed、4Gb、sealed、neW、8GB、black、 new,4GB)的相关度调整因子应当被增大。注意,额外字词可能被列出不止一次,因为这些词 语存在于用户选择的不止一个项目中。自然,来自未被选择的项目描述的额外字词的相关度调整得分将被减小。在一个 实施例中,这种词语必须没有在任何被选择的项目中,并且必须出现在不止一个未选择项 目中。在这种实施例中,词语“transmitter”和“leather”的调整相关度得分可被减小。
确定相关度调整因子图2示出了描述一个可能的实施例可如何修改描述中的额外字词的相关度调整 因子的高层流程图。额外字词的初始相关度调整因子可被设定为中性值,例如一(“1”)。 图3示出了可用于本发明的各种实施例中的一些数据库表。参考图2的顶部,系统首先在阶段210接收搜索查询。接下来,在阶段220,系统创 建满足来自阶段210的用户的搜索查询的要求的一组搜索结果。注意,如下所述,可以按相 关度来整理该组搜索结果。
在阶段230,系统向用户显示一部分结果。在互联网市场实施例中,结果可包括可 供销售的一组项目。在阶段240,查看搜索结果的另一部分,用户可以选择要更详细查看的 项目,或者离开这组结果。如果用户决定查看搜索结果的另一部分,则系统选择搜索结果的 另一部分来显示,并返回到阶段230以显示这些结果。如果用户决定更详细查看来自这些搜索结果的一项目,则系统前进到阶段250。由 于用户选择了该项目,所以该项目被认为与输入了在阶段210输入的特定搜索查询的人相 关。从而,系统将针对此特定搜索查询增大与这个被选择的项目有关的描述性因素的相关 度调整因子。如前所述,一个实施例使用项目的描述性字段中不是搜索查询的一部分的附加字 词来作为可用于将来识别类似项目的描述性因素。从而,在阶段250,系统从描述字段中识 别不是搜索查询的一部分的字词(如果有的话),并且将这些附加的描述性字词添加到与 流行搜索查询的表310中的一搜索查询条目相关联的数据库表320,如果这些附加字词尚 未在附加描述性字词数据库表320中的话。接下来,在阶段355,系统为在先前阶段中识别的附加描述性字词增大相关度调整 因子。相关度调整因子可被保存在与附加描述性字词相同的数据库表320中。注意,每个 字词的相关度调整因子是针对每个搜索查询进行的,因为描述性字词的相关度将依据项目 而有很大变化。例如,“Persian” 一词对于地毯可能是非常相关的,而对于iPod则是完全 不相关的。在修改所选项目的附加字词的相关度调整因子之后,系统在阶段260更详细地向 用户显示所选项目。另外的处理将取决于阶段270中的用户输入。如果用户请求看下一个 或前一个项目,则系统将获得与该项目相关联的信息,并返回到步骤250以处理该项目的 适当相关度调整因子修改和显示。如果用户决定返回到搜索结果的列表视图,则系统返回 到阶段230,以在列表视图中显示搜索结果。如果用户在阶段270决定离开此特定搜索查询(或者在更早的阶段240离开此搜 索查询),则系统可以判定是否应当进行任何相关度调整因子减小。在阶段280,系统首先 判定是否查看了至少一个项目。如果没有查看项目,则可以不进行相关度调整因子变化,因 为没有关于用户是否真的对所显示的项目感兴趣或不感兴趣的足够信息。如果查看了至少 一个项目,则系统可以前进到步骤290,以可能减小与未被选择的项目相关联的一个或多个 相关度调整因子。系统将识别存在于未被选择的项目中的共同附加描述性字词。在一个实 施例中,系统要求一描述性字词不在任何所选项目中并且在被呈现给用户但未被用户选择 的至少两个项目中,才能减小该描述性字词的相关度调整因子。通过此测试的描述性字词 的相关度调整因子可被减小。注意,不是所有的相关度系统实施例都将实现参考阶段680和690公开的相关度调整因子减小系统。
使用相关度调整因子图4示出了描述一个可能的实施例可如何使用在图2的系统中创建的相关度调整 因子来为搜索结果集中的项目调整相关度得分的高层流程图。注意,图4所示的系统可用 于图2的系统的阶段220内。首先,在步骤410接收搜索查询。然后,在阶段420,系统随后搜索项目数据库以生 成满足在阶段410输入的搜索查询的要求的初始一组结果。在获得初始搜索结果之后,必须按相关度来整理搜索结果。为了实现此目标,系统 在阶段430检索初始结果中的项目的附加描述性字词的相关度调整因子。接下来,在阶段440,相关度调整因子被应用到赋予初始搜索结果中的每个项目的 相关度调整得分。在一个实施例中,相关度调整因子可以被与赋予给一组搜索查询结果中 的项目的初始相关度得分相乘以调整该项目的相关度得分。表2列出了这样一个实施例的 一组可能的相关度调整因子,其中列出了与“ipod nano”搜索查询相关联的一些额外字词。 这些额外字词的相关度调整因子可被正规化以保持在预定范围内。例如,该组相关度调整 因子已被正规化以保持在0至2的范围内。表2 :"ipod nano”搜索查询相关度调整因子 为了应用表2中给出的相关度调整因子,如果一项目在其描述中具有相关联的额 外字词,则相关度调整因子被乘以赋予给该项目的初始相关度得分。从而,参考表2,“ipod nano”搜索查询的结果集中的具有诸如“sealed”、“8GB”和“new”之类的高度相关的附加 描述性字词的项目的相关度得分将增大。类似地,“ipod nano”搜索查询的结果集中的具 有诸如“leather”、“tranSmitter”或“case”之类的很大程度上不相关的附加描述性字词 的项目的相关度得分将减小。可以使用利用相关度调整因子来修改初始相关度得分的许多 其他方法。
在替换实施例中,相关度调整因子可以被加到一项目的初始相关度得分以调整该 项目的相关度得分。表3列出了这样一个实施例的一组可能的相关度调整因子,其中列出 了与“ipod nano”搜索查询相关联的一些额外字词。这些额外字词的相关度调整因子可被 正规化以保持在例如-100至100限定范围内。表3 :"ipod nano”搜索查询相关度调整因子 注意在表3中,非常合乎期望的词语(“Sealed”、“8GB”和“new”)具有大的正相 关度调整因子。类似地,不合期望的词语(“transmitteW'leather”和“case”)具有大 的负得分。其余的中性词语对于相关度得分将具有相对较小的影响。在调整初始的一组相关度得分之后,随后在阶段450随后根据经调整的相关度得 分来对项目排序。经相关度整理的一组项目随后被呈现给用户。由于是在与来自利用同一 查询的先前搜索的先前所选项目类似的项目被放置在顶部的情况下整理结果集的,因此用 户将迅速能够很快找到期望的项目。防止对动态数据集的相关度系统的滥用如对依赖于去到网站的超链接作为该网站的流行度的度量的因特网搜索引擎的 论述中所述,这种因特网搜索引擎可能被创建链接到特定网站的数千个无关网站的人所滥 用。去到特定网站的这众多链接将创建该特定网站很流行的虚假表象。在先前小节中公开 的动态数据集相关度系统上也可尝试类似的滥用方法。例如,互联网市场上的非常激进的卖家可以创建自动化程序,这些程序反复选择 这种激进卖家在互联网市场上发布来供销售的项目。这样,这种激进卖家可能尝试使得其 发布到互联网市场上的项目看起来流行,以使得这些项目将接收到增大的相关度得分。为了防止这种滥用,可以对相关度记分系统施加一组各种不同的限制,以阻止用 户滥用相关度记分系统。可实现为防止这种滥用的第一个限制可涉及正是防止前一段中描 述的那种场景。图5示出了图2中公开的相关度调整因子系统,但添加了防止点击其自己 发布来供销售的项目的激进卖家进行的滥用的步骤。
参考图5,在用户选择一项目来更详细观看后面添加了阶段545。在阶段545,系统 判定该所选项目是否是此特定用户所发布的项目或者此用户是否已经查看过此特定项目。 如果任一情况为真,则系统跳过相关度调整因子修改阶段550和555,而改为直接去往阶段 560,其中系统向用户显示该项目。这样,系统防止了用户反复选择其自己的项目。另外,阶 段545防止了用户创建第二账户,然后从该第二账户反复选择其自己的项目。禾丨■娜丨卜龍在互联网市场系统中,参与互联网市场的买家和卖家拥有声誉得分,以使得人们 拥有关于是否应信任潜在交易的另一方的某种度量,这是很常见的。这些声誉得分一般是 通过让用户在互联网市场上的交易完成(或者以其他方式结束)之后提供关于交易另一方 的反馈来创建的。在所公开的系统的一个实施例中,这种用户声誉得分被结合到了相关度 系统中。将用户声誉得分结合到相关度系统中改善了相关度系统的结果并且减小了滥用相 关度系统的可能性。图6示出了用于动态数据集的相关度得分调整系统,其中与每个用户相关联的声 誉得分被结合到相关度系统中。图6的系统与图5的系统相同,只不过在对相关度调整因 子做出改变时考虑了用户的声誉。具体而言,阶段655被改变,以表明系统将相关度调整因 子增大一与用户的声誉得分相联系的量。类似地,阶段690被改变,以表明用户将相关度调 整因子减小一与用户的声誉得分相联系的量。将用户声誉得分结合到相关度系统中向相关度系统提供了若干重大优点。一个优 点在于对相关度调整因子做出的改变可以以与用户的技能相联系的方式来做出。有经验的 用户将具有更高的声誉得分,从而该有经验的用户进行的选择对相关度系统的改变将大于 新手用户。另一优点在于,将用户声誉得分结合到相关度系统中可用于防止对相关度系统的 滥用。具体而言,激进的卖家可尝试阻挠在阶段645中阐述的只允许特定用户选择一项目 一次的限制,以通过创建大量新账户并且从这些新账户中的每一个选择用户的项目来调整 该项目。通过将新账户的声誉得分设定为零或另外的低值,这种新账户进行的选择对于相 关度系统将没有影响或者只有极小的影响。从而,创建大量新账户无法被用于滥用相关度 系统。在一个实施例中,用户对于在互联网市场上可得的不同类别的产品可能具有不同 的声誉得分。从而,一个人在购买和销售电子设备方面的声誉可能较高,而在购买和销售家 庭用品方面的则可能只有很新手的声誉。在这种实施例中,系统将会识别所搜索的产品的 类别,并且在对相关度调整因子做出改变时使用在该类别中用户的声誉。这样,系统考虑了 一个人的特定技能集,使得其在其高声誉的类别中的选择将对相关度系统具有重大影响, 而其在其他领域中的选择则不会对相关度系统有重大影响。注意,这将要求用户参与大量 成功交易,然后用户的选择才能对相关度具有重大影响。这帮助了防止一个人尝试创建许 多账户,每个账户参与一个交易,然后使用这许多账户来滥用相关度系统。^mm^^mm^ 已经公开的用于动态数据集的相关度系统可与基于其他因素的其他相关度系统 相集成。例如,一种替换系统在确定相关度时可使用卖家的声誉,使得具有更高声誉的卖家 比具有低声誉的卖家接收到更高的相关度得分。在这种系统中,在搜索结果的顶部,将向买家呈现更可靠的卖家。所给出的用于动态数据集的相关度系统可与这种系统(或多个其他 相关度系统)相组合,以使得组合的相关度得分被用于呈现搜索结果。虽然已经参考互联网市场实施例公开了相关度系统,但是必须强调,相关度系统 可用于许多其他实施例中。在其他实施例中,可以用用户在一系统中的经验的另一类似度 量来替换用户声誉得分。例如,在消息发布板的实施例中,可以用该用户发贴的数目来替换 用户声誉得分。另外,已经利用在项目的描述字段中的其他字词的描述性因素来描述了本 发明,但是也可使用将来可用于识别类似项目的任何其他描述性因素。本说明书意欲为例示性的而非限制性的。例如,上述实施例(或其一个或多个方 面)可以相互组合使用。本领域的技术人员在阅读本说明书之后将明显看出其他实施例。 因此,应当参考所附权利要求以及与这种权利要求被授权的范围相等同的完整范围来确定 权利要求的范围。在所附权利要求中,术语“including”(包括)和“in which”(其中) 用作相应术语“comprising”(包括)和“wherein”(其中)的普通英语等同。另外,在以 下权利要求中,术语“ including”和“comprising”是开端的,即,包括除了权利要求中的这 种术语之后列出的元素以外的元素的系统、设备、物品或过程仍被视为落在该权利要求的 范围内。另外,在以下权利要求中,术语“第一”、“第二”和“第三”等等只是用作标签,而并 不意欲对其对象施加数值要求。摘要是遵循37 C. F. R. § 1. 72 (b)提供的,37 C. F. R. § 1. 72 (b)要求其使读者可 以迅速地确定技术公开的性质。它是在具有以下理解的情况下提交的它不会被用于解释 或限制权利要求的范围或含义。另外,在以上“具体实施方式
”部分中,各种特征被归组在 一起以使公开流畅。这不应被解释为希望未要求保护的所公开特征对于任何权利要求是必 要的。更确切地说,创造性主题可存在于所公开的特定实施例的非全部特征中。从而,特此 将以下权利要求结合到“具体实施方式
”部分中,其中每个权利要求独立作为一单独的实施 例。
权利要求
一种从搜索查询结果推断相关度的方法,所述方法包括接受来自搜索引擎的用户的搜索查询;响应于来自用户的搜索查询生成一组搜索结果项目;向所述用户显示所述一组搜索结果项目;接受所述用户对来自所述一组搜索结果项目的一项目的选择;以及修改针对与所述用户从所述一组搜索结果项目中选择的所述项目相关联的第一描述性因素的相关度调整因子,所述调整与所述用户的声誉得分相联系。
2.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,所述用户的所述声 誉得分包括利用由与所述用户进行交易的其他方给出的评定生成的得分。
3.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,与从所述一组搜索 结果项目中选择的所述项目相关联的所述第一描述性因素包括来自所述项目的描述字段 的、未包含在所述搜索查询中的字词。
4.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,响应于来自用户的 搜索查询生成一组搜索结果项目包括利用基于所述相关度调整因子的合成相关度得分来 对所述搜索结果项目排名。
5.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,针对与所述项目相 关联的所述第一描述性因素的相关度调整因子的所述修改在所述用户发布了所述项目时 不被执行。
6.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,针对与所述项目相 关联的所述第一描述性因素的所述相关度调整因子仅对所述用户输入的搜索查询有效。
7.如权利要求1所述的从搜索查询结果推断相关度的方法,所述方法还包括 修改针对与所述一组搜索结果中未被所述用户选择的项目相关联的第二描述性因素的相关度调整因子,所述调整与所述用户的声誉得分相联系。
8.如权利要求7所述的从搜索查询结果推断相关度的方法,其中,所述第二描述性因 素在不止一个项目中并且不在被所述用户选择的所述项目中。
9.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,所述相关度调整因 子被用于调整搜索结果项目的相关度得分。
10.如权利要求1所述的从搜索查询结果推断相关度的方法,其中,所述搜索结果项目 包括在在线市场中供销售的项目。
11.一种计算机可读介质,所述计算机可读介质包括用于从搜索查询结果推断相关度 的一组指令,所述一组指令实现接受来自搜索引擎的用户的搜索查询; 响应于来自用户的搜索查询生成一组搜索结果项目; 向所述用户显示所述一组搜索结果项目;接受所述用户对来自所述一组搜索结果项目的一项目的选择;以及 修改针对与所述用户从所述一组搜索结果项目中选择的所述项目相关联的第一描述 性因素的相关度调整因子,所述调整与所述用户的声誉得分相联系。
12.如权利要求11所述的计算机可读介质,其中,所述用户的所述声誉得分包括利用 由与所述用户进行交易的其他方给出的评定生成的得分。
13.如权利要求11所述的计算机可读介质,其中,与从所述一组搜索结果项目中选择的所述项目相关联的所述第一描述性因素包括来自所述项目的描述字段的未包含在所述 搜索查询中的字词。
14.如权利要求11所述的计算机可读介质,其中,响应于来自用户的搜索查询生成一 组搜索结果项目包括利用基于所述相关度调整因子的合成相关度得分来对所述搜索结果 项目排名。
15.如权利要求11所述的计算机可读介质,其中,针对与所述项目相关联的所述第一 描述性因素的相关度调整因子的所述修改在所述用户发布了所述项目时不被执行。
16.如权利要求11所述的计算机可读介质,针对与所述项目相关联的第一描述性因素 的所述相关度调整因子仅对所述用户输入的搜索查询有效。
17.如权利要求11所述的计算机可读介质,其中所述计算机指令还实现修改针对与所述一组搜索结果中未被所述用户选择的项目相关联的第二描述性因素 的相关度调整因子,所述调整与所述用户的声誉得分相联系。
18.如权利要求17所述的计算机可读介质,其中,所述第二描述性因素在未被所述用 户选择的不止一个项目中并且不在被所述用户选择的所述项目中。
19.如权利要求11所述的计算机可读介质,其中,所述相关度调整因子被用于调整搜 索结果项目的相关度得分。
20.如权利要求11所述的计算机可读介质,其中,所述项目包括在在线市场中供销售 的搜索结果项目。
全文摘要
公开了用于确定动态数据集的相关度的系统和方法。给出了用于互联网市场中的特定实施例,其中与一项目相关联的描述性因素的相关度在用户选择该项目时被增大。为了防止对相关度确定系统的滥用,各种实施例结合了滥用防止措施。在一个实施例中,用户对其自己的项目的选择不会影响相关度系统。在一个实施例中,只有用户对特定项目的第一次选择才会影响相关度系统,对该项目的任何另外选择将没有影响。在另一实施例中,由于特定用户的选择而对相关度系统做出的改变的大小与该用户的声誉得分相联系。
文档编号G06F17/30GK101884042SQ200880118613
公开日2010年11月10日 申请日期2008年11月25日 优先权日2007年11月30日
发明者尼拉科坦·萨达瑞森 申请人:电子湾有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1