比较性web搜索的制作方法

文档序号:6454121阅读:102来源:国知局
专利名称:比较性web搜索的制作方法
比较性web搜索背景计算机用户通常利用连接到因特网或一信息数据库的计算设备来比较 类似的项目。确实,用户通过因特网比较产品或服务的商店是相当普遍的。 例如,用户可能希望在他/她做出购买决定之前比较两个候选产品。传统的 搜索引擎返回根据其与输入查询的相关性排序的一组网页或文档。虽然这 可能有助于搜索与该搜索查询相关的页面和/或文档,但这些结果即使不是 根本不提供,也通常不以高效的方式提供用户需要的比较信息。一般地,向用户呈现包含搜索査询中所提供的(诸)单词的任何页面 或文档,而不管这些页面或文档在将所搜索的产品或服务与另一类似产品 或服务进行比较时是否提供有用的信息。这迫使用户审阅基本没有价值的 众多页面。事实上,即使所搜索的页面包括有用的比较性信息,用户也必 须进行若干査询并独立地确定在不同的查询中哪一些包括类似的信息。因 此,所需要的是用于执行对诸如产品或服务等两个或更多相关项目的比较 性搜索的高效的方法和系统。概述提供了从诸如因特网或Web等网络或数据库中搜索相关的和比较性信 息的方法和系统。在一示例中,在接收到表示用户想要比较的主题的多个 查询时, 一系统可以基于其与査询的相关性和其包含的比较性内容自动检 索并排列网页。在一示例中,比较性页面被成对地或以其它分组形式显示。在另一示例中,具有类似内容的比较性结果可以被群集成语义上有意 义的主题。为帮助用户容易地捕捉每一主题的比较性内容,可以提取显著 短语来概括每一主题中的比较性内容。在一个这样的示例中, 一图形用户 界面可以允许用户査看比较性页面和比较性集群。结合附图阅读下面的详细描述,则本发明的这些和其它优点会变得显 而易见。可通过结合附图参考以下描述来获得对本发明及其优点的更完整 的理解,附图中相同的参考标号指示相同的特征。本发明按照其示例性实 施例来描述。通过细读以上公开内容,本领域的技术人员可以清楚所附权
利要求书的范围和精神内的多种其它实施例、修改和变化。 附图简述

图1示出了在其中可以实现本发明各实施例的示例性计算机系统。图2是排列比较性搜索结果的示例性方法的流程图。详细描述示續藻脾裙图1是可结合各种输入设备使用的常规通用数字计算环境的一个示例 的功能框图。在图1中,计算机100包括处理单元110、系统存储器120 和将包括系统存储器的各种系统组件耦合到处理单元110的系统总线130。 系统总线130可以是若干类型总线结构中的任一种,包括存储器总线或存 储器控制器、外围总线以及使用各类总线体系结构中的任一种的局部总线。 系统存储器120包括只读存储器(ROM) 140和随机存取存储器(RAM) 150。包含如在启动时帮助在计算机100中的元件之间传输信息的基本例程 的基本输入/输出系统160 (BIOS)被存储在ROM 140中。计算机100也包 括用于对硬盘(未示出)进行读写的硬盘驱动器170、用于对可移动磁盘 190进行读写的磁盘驱动器180、以及用于对诸如CD ROM或其它光学介 质等可移动光盘192进行读写的光盘驱动器191。硬盘驱动器170、磁盘驱 动器180和光盘驱动器191分别由硬盘驱动器接口 192、磁盘驱动器接口 193和光盘驱动器接口 194连接到系统总线130。驱动器及其关联的计算机 可读介质为个人计算机100提供了计算机可读指令、数据结构、程序模块 和其它数据的非易失存储。本领域的技术人员可以理解,在示例操作环境 中也可以使用可储存可由计算机访问的数据的其它类型的计算机可读介 质,如磁带盒、闪存卡、数字视频盘、贝努利盒式磁带、随机存取存储器 (RAM)、只读存储器(ROM)等等。众多程序模块可储存在硬盘驱动器170、磁盘190、光盘192、 ROM 140 或RAM 150中,包括操作系统195、 一个或多个应用程序196、其它程序 模块197和程序数据198。用户可通过诸如键盘101和定位设备102等输入 设备向计算机100输入命令和信息。其它输入设备(未示出)可包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合到系统总线的串行端口接口 106连接到处理单元IIO,但也可 通过其它接口进行连接,如并行端口、游戏端口和通用串行总线(USB)。 所示的计算机100包括可任选的PCMCIA接口 103,其可以将根据本发明 的输入设备的至少一个实施例连接到计算机100。此外,这些设备可通过适 当的接口 (未示出)直接耦合至系统总线130。监视器107或其它类型的显 示设备也经由诸如视频适配器108等接口连接至系统总线130。除监视器之 外,个人计算机通常包括其它外围输出设备(未示出),如扬声器或打印 机。计算机100可使用到一个或多个诸如远程计算机109这样的远程计算 机的逻辑连接在网络化环境中操作。远程计算机109可以是服务器、路由 器、网络PC、对等设备或其它常见的网络节点,并通常包括以上相对于计 算机IOO所描述的许多或所有元件,尽管图1中仅示出了存储器存储设备 111。图1所描述的逻辑连接包括局域网(LAN) 112和广域网(WAN) 113。 这样的联网环境在办公室、企业范围计算机网络、内联网和因特网中是常 见的。当在LAN联网环境中使用时,计算机IOO通过网络接口或适配器114 连接到局域网112。当在WAN联网环境中使用时,个人计算机100通常包 括调制解调器115或用于通过广域网113,如因特网建立通信的其它装置。 或为内置或为外置的调制解调器115经由串行端口接口 106连接到系统总 线130。在网络化环境中,相对于个人计算机IOO所描述的程序模块或其部 分可以存储在远程存储器存储设备中。可以理解,所示的网络连接是说明性的,可以使用在计算机之间建立 通信链路的其它技术。假定存在各种公知协议的任一种,如TCP/IP、以太 网、FTP、 HTTP、蓝牙、IEEE 802.11x等等,且系统可在客户机一服务器 配置中操作,以准许用户从基于web的服务器检索网页。可以使用各种常 规web浏览器中的任一种来显示并操控网页上的数据。说欲丝J 應贿游^"述图2是根据本发明的一个实施例的排列比较性搜索结果的示例性方法 的流程图。可以理解,参考该方法描述的这些步骤可以在任何计算设备中实现。在示例性步骤205,接收第一搜索查询。该搜索査询可以由具有诸如 微软的Internet Explorer⑧web浏览器等通过如广域网113操作上连接到 因特网的web浏览器的计算设备发送。虽然步骤205中所示的搜索和贯穿 本说明书的其它搜索可以用参考因特网或web的方式示出,但本领域的技 术人员将容易理解,这些方法可以在包括内联网的任何网络中进行。在步骤210,接收与第一査询相关的至少一个第二搜索査询。通过相 关,这些搜索共享一共同主题。例如,第一搜索查询可能涉及Microsoft Xbox 游戏控制台而第二搜索查询可以涉及Sony Playstation 。在这样 一个示例中,这两个搜索都涉及个人游戏设备。当然,其它搜索査询可以 涉及其它个人游戏设备。就此而言,搜索查询允许用户输入用户正考虑购 买的两个竞争产品或服务。第二搜索査询还可以从本领域公知的浏览器中发送。另选地,可以利 用向用户呈现允许输入两个或更多查询的图形用户界面的经修改的浏览 器。用户可以在单个页面上或在该过程的不同阶段提供搜索査询。搜索査 询可以采用,例如布尔项或自然语言的形式。本领域技术人员理解,査询 可以用多种形式呈现,每一形式都可以结合本发明的教导来使用。在示例性步骤215,处理第一搜索查询以产生第一搜索结果,并处理 第二搜索查询以产生第二搜索结果。在一实施例中,利用了布尔和/或关键 字搜索引擎。在搜索査询基于相关性而与对应的网页匹配的实施例中,在 向搜索引擎提交搜索査询时, 一进程从该搜索査询中提取文字权标。在一 实施例中,随后进行搜索以寻找在文字权标级最优匹配该查询的文档。匹 配的紧密度最通常基于文档是否满足由这些査询项所构成的布尔表达式, 或基于查询和文档中的项的加权集,如公知的"矢量空间模型"(参见, 例如"Automatic Text Processing (自动文本处理)", G. Salton [Addison-Wesley, 1989],第10.1.1节)本领域技术人员将认识到,还有处理 搜索査询的其它更多特定方法。虽然该示例性步骤在同一步骤中处理第一和第二搜索査询,但是本领 域技术人员将容易理解,可以由不同的进程在不同的时间处理搜索查询。
例如,用户可以选择将先前关于第一产品执行的搜索査询与稍后或当前正 在执行的搜索查询进行比较。在步骤220,生成多个比较性搜索结果组,其中每一结果组都包括一 来自于第一搜索结果的元素和一来自于第二搜索结果的元素。在一实施例 中,表达为方程(1)的函数可以被用来估计两个页面形成与两个输入查询 相对应的比较性对的可能性。fql,q2(pl,p2)=ot. R(pl,ql) + P . R(p2,q2)+y' S(pl\ql,p2\q2) pl e SRI, p2 e SR2 (方程1)其中,该函数被用来为输入査询ql和q2生成比较性信息。第一种方法是 自动重排在步骤205和210所利用的搜索引擎("SE")所返回的搜索结 果。假定函数中的"SR1"和"SR2"表示与分别在步骤205和210执行的 查询ql和q2相对应的结果页面。与通常按照其与查询的相关性进行排名 的传统搜索函数不同,该函数重排SR1和SR2以显示比较性页面组,如以 下更详细地解释的对。假定"pl"和"p2"分别是来自于SR1和SR2的两 个页面。通过使用"R"表示査询对于页面的相关性而使用"S"表示两个 文本片段之间的相似性,示为方程1的函数可被用来估计两个页面形成与 两个输入查询相对应的比较性对可能性。在方程1中,pl\ql和p2\q2分别表示在删除包含于ql和q2中的项 之后页面pl和p2的剩余文本内容。因此,S(pUql,p2、2)测量pl和p2中 与ql和q2相关联的较性信息的数量。函数f考虑页面和其对应的査询之 间的相关性,以及包含于该两个页面中的比较性信息。在一实施例中,参 数a和J3被设为相等,以便同等地对待与两个査询相对应的相关性测量。f的计算基于摘录文本。所有可能的页面对E二 {pl,p2|pl G SRl,p2 E SR2)都根据fql,q2 (pl, p2)以降序排列。具有最高排名的对将被选为比较 性对且该对的两个页面被插入到集合P中。所有剩余页面对将被过滤且包 含P中的页面的那些被从E中删除。随后从更新过的集合E中选择第二比 较性对。采用这一策略,可以删除那些包含重复页面的对并根据fql,q2排 列所有的比较性页面对。在完成步骤220时,可以启动步骤225和/或230。在步骤230,确定 是否显示在步骤220中所生成的将以成对的方式显示的组的至少一个。在 一个这样的实施例中,用户可以被准许选择一选项以激活或停用以成对的 方式的一个或多个组的显示。"成对"所指的是,为在显示设备上容易査看,关联了至少一个比较性结果组。如果是,则可以实现步骤245。每一对 都包含与两个输入査询都相关的比较性内容。例如,第一对可以是 Microsoft Xbox⑧游戏控制台站点和Playstation Global站点的主页。第二 对可以包含IGN评论的页面。在一实施例中,可以调整网页的尺寸以使该组中的两个结果同时迈合 在单一显示器上。例如,关于上述搜索的一个比较性结果组可以产生由 Xbox⑧的MSN.com评论和Playstation⑧的MSN.com评论所组成的比较性结 果组。可以调整两个网页来适合于单一显示区域中。然而,在具有多个显 示器的计算环境中,可以将网页显示在不同的监视器或显示设备上。在又 一实施例中,包括该对的网页以选项卡显示在单一应用程序中,以使用户 可以通过在各选项卡之前切换来容易地以成对的方式比较网页。事实上, 使网页一起成对的任何分组都落入本发明的范围之内。此外,本领域技术 人员容易理解,出于帮助读者理解本发明的范围的简单理由,选择了两个 网页来描述本发明的各方面,并且在不止两个网页形成比较性结果组时, 可以用对应于网页的数目的方式来显示结果(即,在三个网页形成一组时 以三个一组显示)。在再一实施例中,可以向用户只提取和显示相关网页的一部分(即, 步骤240)。该实施例可以被实现而不管结果是否以成对的方式显示。例如, 该提取内容可由出现在步骤205和/或210所搜索的单词的预定邻近度之内 的文本(和/或图)所组成。在其它实施例中,该提取内容可以包括出现在 将一个组同另一个组分开的单词的预定邻近度之内的文本和/或图。例如, 使用上述关于游戏设备的搜索査询,比较性结果组可以包括价格、消费者 满意度、可用游戏等。在一个这样的实施例中,可以准许用户选择预定邻 近度。或结合或独立于步骤230,也可以实现和步骤225。在步骤225,确定 在步骤220的结果中是否存在类似的比较性结果组。例如,在一实施例中, 如果步骤220的比较性结果组包括各自都包括关于所搜索的游戏设备的价
格的信息的若干对(或三个一组等),则可以实现步骤235。在步骤235, 群集包括类似信息的比较性搜索结果组的子集。在一个这样的实施例中,还实现步骤240,其中可以向用户提取并显 示网页的一部分。在一实施例中,其中网页的子集都考虑定价,则可使用 提取技术来向用户显示结果中的文本以传达该成本是该子集中共同的主 题。在一实现中,可以为描述该共同主题的每一子集生成一超链接或其它 选择机制并允许用户选择该超链接以进一步调査该子集中的网页。在一示 例中,在选择某一子集时,用户可以确定是否以如参考步骤230所讨论的 成对的方式选择那些对中的网页。本发明是按照其示例性实施例来描述的。通过细读以上公开内容,本 领域的技术人员可以清楚所附权利要求书的范围和精神内的多种其它实施 例、修改和变化。例如,本领域技术人员将认识到,可使用不同方法来进 行比较性搜索查询而不背离本发明的范围。此外,所描述的方法的一个或 多个步骤可被省略或重复,且在一些实例中以与上述不同的次序来执行。
权利要求
1. 一种用于排列比较性web结果的计算机实现的方法,包括如下步骤(a)接收第一搜索查询;(b)接收与所述第一搜索查询相关的第二搜索查询;(c)处理所述第一搜索查询以产生第一搜索结果,并处理所述第二搜索查询以产生第二搜索结果;以及(d)生成多个比较性搜索结果组,其中每一组都包括一来自于所述第一搜索结果的元素和一来自于所述第二搜索结果的元素。
2. 如权利要求1所述的计算机实现的方法,其特征在于,(d)的至 少一个搜索结果组是一对网页。
3. 如权利要求2所述的计算机实现的方法,其特征在于,还包括以下步骤(e) 以成对的方式显示所述网页对。
4. 如权利要求2所述的计算机实现的方法,其特征在于,还包括以下步骤(e)提取所述对中每一网页的至少一部分,所述部分包括来自于所述 第一或第二搜索结果中的任一个的至少一个元素。
5. 如权利要求1所述的计算机实现的方法,其特征在于,所述第一 搜索査询涉及消费产品,且所述第二搜索查询涉及类似消费产品。
6. 如权利要求1所述的计算机实现的方法,其特征在于,使用方程 (l)生成所述多个比较性搜索结果组。
7. 如权利要求1所述的计算机实现的方法,其特征在于,还包括以下步骤(e) 确定在(d)中生成的所述多个比较性搜索结果组的一子集包括类 似信息;以及(f) 将所述子集群集成一个集群。
8. 如权利要求7所述的计算机实现的方法,其特征在于,还包括以 下步骤(g)提取所述集群中的至少一个网页的至少一部分,所述部分包括包 括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
9. 一种用于通过浏览器从操作上连接到网络(113)的计算设备(100) 获取比较性web结果的计算机实现的方法,包括如下步骤(a) 发送第一搜索请求以获取第一搜索结果;(b) 发送与所述第一搜索请求相关的第二搜索请求以获取第二搜索结果;(c) 接收多个比较性搜索结果组,其中每一组都包括一来自于所述第 一搜索结果的元素和一来自于所述第二搜索结果的元素。
10. 如权利要求9所述的计算机实现的方法,其特征在于,(c)的至 少一个搜索组是一对网页。
11. 如权利要求IO所述的计算机实现的方法,其特征在于,还包括 以下步骤(d) 在显示设备(107)上以成对的方式向用户显示所述网页对。
12. 如权利要求9所述的计算机实现的方法,其特征在于,还包括以 下步骤(d) 提取所述对中的每一网页的至少一部分,所述部分包括包括来自 于所述第一或第二搜索结果中的任一个的至少一个元素;以及(e) 向用户显示所述对中的所述网页的所述部分。
13. 如权利要求9所述的计算机实现的方法,其特征在于,在步骤(c) 接收到的所述多个比较性搜索结果组是根据合并了方程(l)的方法生成的。
14. 如权利要求9所述的计算机实现的方法,其特征在于,还包括以 下步骤(d)显示包括在(c)中生成的所述多个比较性搜索结果组的、包括类 似信息的子集的集群。
15. 如权利要求14所述的计算机实现的方法,其特征在于,还包括 以下步骤(e)显示所述多个比较性搜索结果的所述子集中的信息的概要,所述概要包括来自于所述第一或第二搜索结果中的任一个的至少一个元素。
16. —种用于排列比较性web结果的计算设备(100),所述设备具 有处理器(110)和计算机可读介质(170),所述计算机可读包括计算机可读指 令,其被执行时用以执行如下方法(a) 接收第一搜索査询;(b) 接收与所述第一搜索査询相关的第二搜索査询;(c) 处理所述第一搜索査询以产生第一搜索结果,并处理所述第二搜 索查询以产生第二搜索结果;以及(d) 生成多个比较性搜索结果组,其中每一组都包括一来自于所述第 一搜索结果的元素和一来自于所述第二搜索结果的元素。
17. 如权利要求16所述的计算设备,其特征在于,(d)的至少一个搜 索组是一对网页。
18. 如权利要求17所述的计算设备,其特征在于,所述计算机可读 指令还包括如下步骤(e) 提取所述对中的每一网页的至少一部分,所述部分包括包括来自 于所述第一或第二搜索结果中的任一个的至少一个元素。
19. 如权利要求16所述的计算设备,其特征在于,(d)包括方程(l)。
20. 如权利要求16所述的计算设备,其特征在于,所述计算机可读 指令还包括如下步骤(e)确定在(d)中生成的所述多个比较性搜索结果组的一子集包括类 似信息;以及(f)将所述子集群集成一个集群。
全文摘要
提供了执行比较性搜索的方法和系统。在一示例中,该比较性搜索通过诸如web或数据库等网络执行。在一示例性实现中,用户发送表示用户想要比较的主题的多个查询,且计算系统可以基于其与查询的相关性和其包含的比较性内容自动检索并排列网页或文档。在这样一个示例中,比较性页面被成对地或以其它分组形式显示。在另一示例中,具有类似内容的比较性结果可以被群集成有意义的主题。
文档编号G06F17/30GK101395605SQ200780007332
公开日2009年3月25日 申请日期2007年2月28日 优先权日2006年3月1日
发明者D·沈, H-J·曾, J·王, J-T·孙, X·王, Z·陈 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1