用于查询细化的系统和方法

文档序号:6649277阅读:194来源:国知局
专利名称:用于查询细化的系统和方法
技术领域
本发明的实施例涉及用于细化用户查询的技术,尤其涉及用于向用户提供适当的搜索结果的技术。
背景技术
通过因特网的其它网络,用户获取对分布在大量计算机上的大量信息的访问。为访问该巨大数量的信息,用户通常实现用户浏览器来访问搜索引擎。搜索引擎通过返回可通过因特网或其它网络获得的一个或多个信息源来响应输入的用户查询。
当前,当实现搜索引擎时,用户输入一个或多个关键词,并接收一组结果。取决于由用户输入的特定项,搜索引擎产生多个结果。在某些情况下,用户选择的项可能不导致搜索引擎定位期望的信息。具体地,当用户输入通常包含了太多信息的多词查询时,用户常常对由搜索引擎产生的不令人满意的或最小限度的结果感到失望。
在操作中,搜索引擎通常实现爬寻器(crawler)来访问多个网站,并在索引中储存对那些网站的引用。索引中的引用可基于一个或多个关键词来分类。搜索引擎也可将某些结果储存在高速缓存中。
当响应于用户查询时,搜索引擎可首先遍历该索引,以定位输入的查询项。然而,在许多情况下,索引中的项可能不对应于输入的查询项。期望信息可以基于同义项或关键词的替换组合来索引。由此,为接收期望的搜索结果,用户可在接收可接受的结果或任何结果之前实现反复试验技术并多次输入查询项。
当现有搜索引擎接收无法在索引中找到的用户输入查询项时,这些现有搜索引擎通常无法提供任何结果。某些搜索引擎将试图进行拼写纠正并重新发出搜索。然而,如果用户希望搜索输入项的变体,则通常要求用户用不同的输入项来重复搜索。
因此,需要一种用于处理多词搜索查询的解决方案,该解决方案通过基于所返回的搜索结果的数量或质量自发地拓宽输入查询来确保适当结果的供应。较佳地,这一解决方案将确保获得最大数量的相关结果。

发明内容
本发明的实施例针对一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的方法。该方法包括在搜索引擎内实现用于评估初始搜索结果的适当性的结果评估机制。该方法还包括如果初始搜索结果被该结果评估机制认为是不适当的,则制定至少一个替换查询,以及显示包括初始搜索结果以及任何制定的替换查询的清单的结果信息。
其它实施例针对一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的方法。该实施例包括将多词用户查询剖析成多个子查询,并通过确定子查询结果的数量或子查询结果的相关度或数量和相关度的组合来确定多个子查询的有效性。该方法还可包括显示初始搜索结果、子查询以及确定的子查询有效性。
在其它实施例中,可提供一种用于响应于多词用户输入自动增强由搜索引擎产生的初始搜索结果的系统。该系统可包括搜索引擎内用于评估初始结果的适当性的结果评估机制。该系统还可包括用于如果初始搜索结果由结果评估机制评估为不适当,则制定替换查询的替换查询确定机制。该系统还包括用于输出替换查询以及初始搜索结果以供显示的结果输出组件。


本发明在下文中参考附图来详细描述,附图中图1是示出依照本发明的一个实施例的系统的综述的框图;图2是示出其中可实现本发明的计算机化的环境的框图;图3是示出依照本发明的一个实施例的查询细化组件的框图;图4是示出依照本发明的一个实施例的结果评估机制的框图;以及图5是示出依照本发明的一个实施例用于细化用户查询的方法的流程图。
具体实施例方式
I.系统综述图1是示出依照本发明的实施例的系统综述的框图。包括用户浏览器12的用户计算机10可通过网络20与搜索引擎200连接。搜索引擎200可包括,例如web爬寻器210、索引220、高速缓存230。搜索引擎200可包括其它标准组件,这些组件为简明起见被省略不作描述。搜索引擎200也可包括查询细化组件300。查询细化组件230可在搜索引擎200无法产生适当的结果时细化来自用户计算机10和用户浏览器12的用户查询。通常,搜索引擎200基于由web爬寻器210遍历的网站,如网站30来维护索引220。
本发明的实施例包括用于当搜索引擎无法产生适当的结果时细化用户查询以避免遇到僵局的方法和系统。结果可能由于在数量上太少或在相关度上太低而不适当。在操作中,系统和方法的实施例可确定结果是不适当的,并给予用户拓宽输入查询的建议。不适当的结果可以通过诸如对点击通过率的评估等已知技术来确定,或者可以基于阈值数来确定。
当结果被认为不合适时,查询细化组件300可将多词查询分解成子查询。在对每一子查询返回结果之后,查询细化组件300可捕捉前面的结果的相关度以及子查询的结果数量。最后,搜索引擎200可输出具有需要数量的结果或具有需要阈值相关度的所有结果集。
II.示例性操作环境图2示出了适合在其中实现本系统和方法的查询细化的计算系统环境100的一个示例。计算系统环境100仅为合适的计算环境的一个示例,并非对本发明的使用范围或功能提出任何局限。也不应将计算环境100解释为对示例性操作环境100中示出的任一组件或其组合具有任何依赖或需求。
本发明在诸如由计算机执行的程序模块等计算机可执行指令的一般上下文环境中描述。一般而言,程序模块包括例程、程序、对象、组件、数据结构等等,它们执行特定的任务或实现特定的抽象数据类型。此外,本领域的技术人员可以理解,本发明可以用于其它计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费者电子设备、小型机、大型机等等。本发明也可以在分布式计算环境中实践,其中,任务由通过通信网络连接的远程处理设备来执行。在分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质中。
参考图2,用于实现本发明的示例性系统包括计算机110形式的通用计算设备,包括处理单元120、系统存储器130以及将包括系统存储器的各类系统组件耦合至处理单元120的系统总线121。
计算机110通常包括各种计算机可读介质。作为示例而非局限,计算机可读介质包括计算机存储介质和通信介质。系统存储器130包括以易失性和/或非易失性存储器形式的计算机存储介质,如只读存储器(ROM)131和随机存取存储器(RAM)132。基本输入/输出系统133(BIOS)包括如在启动时帮助在计算机110内的元件之间传输信息的基本例程,通常储存在ROM 131中。RAM 132通常包含处理单元120立即可访问或者当前正在操作的数据和/或程序模块。作为示例而非局限,图2示出了操作系统134、应用程序135、其它程序模块136和程序数据137。
计算机110也可包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作示例,图2示出了对不可移动、非易失性磁介质进行读写的硬盘驱动器141、对可移动、非易失性磁盘152进行读写的磁盘驱动器151以及对可移动、非易失性光盘156,如CD ROM或其它光介质进行读写的光盘驱动器155。可以在示例性操作环境中使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于,磁带盒、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等等。硬盘驱动器141通常通过不可移动存储器接口,如接口140连接到系统总线121,磁盘驱动器151和光盘驱动器155通常通过可移动存储器接口,如接口150连接到系统总线121。
上文讨论并在图2出的驱动器及其相关联的计算机存储介质为计算机110提供了计算机可读指令、数据结构、程序模块和其它数据的存储。例如,在图2中,示出硬盘驱动器141储存操作系统144、应用程序145、其它程序模块146和程序数据147。注意,这些组件可以与操作系统134、应用程序135、其它程序模块136和程序数据137相同,也可以与它们不同。这里对操作系统144、应用程序145、其它程序模块146和程序数据147给予不同的标号来说明至少它们是不同的副本。用户可以通过输入设备,如键盘162和定位设备161(通常指鼠标、跟踪球或触摸板)向计算机110输入命令和信息。其它输入设备(未示出)可包括麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常通过耦合至系统总线的用户输入接口160连接至处理单元120,但是也可以通过其它接口和总线结构连接,如并行端口、游戏端口或通用串行总线(USB)。监视器191或其它类型的显示设备也通过接口,如视频接口190连接至系统总线121。除监视器之外,计算机也可包括其它外围输出设备,如扬声器197和打印机196,它们通过输出外围接口195连接。
本发明中的计算机110可以使用到一个或多个远程计算机,如远程计算机180的逻辑连接在网络化环境中操作。远程计算机180可以是个人计算机,并通常包括许多或所有相对于计算机110所描述的元件,尽管在图2中仅示出了存储器存储设备181。图2描述的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也可包括其它网络。
当在LAN网络环境中使用时,计算机110通过网络接口或适配器170连接至LAN 171。当在WAN网络环境中使用时,计算机110通常包括调制解调器172或用于通过WAN 173,如因特网建立通信的其它装置。调制解调器172可以是内置或外置的,通过用户输入接口160或其它适当的机制连接至系统总线121。在网络化环境中,相对于计算机110所描述的程序模块或其部分可储存在远程存储器存储设备中。作为示例,而非局限,图2示出远程应用程序185驻留在存储器设备181中。可以理解,示出的网络连接是示例性的,也可以使用在计算机之间建立通信链路的其它手段。
尽管未示出计算机110的许多其它内部组件,然而本领域的普通技术人员可以理解,这些组件和互连是公知的。因此,关于计算机110的内部构造的其它细节无需结合本发明来揭示。
III.本发明的系统和方法如上所述,图1是示出依照本发明的实施例的系统综述的框图。诸如用户计算机10等包括用户浏览器12的用户计算机可通过网络20与搜索引擎200连接。网络20可以是因特网,或者可以是上文参考图2所描述的网络类型中的任一种。
搜索引擎200可包括web爬寻器210、web索引220和高速缓存230。web爬寻器通常在常规的基础上遍历网站30,并在索引220中索引网站30,以响应于用户输入查询而容易地访问结果。查询细化组件300可在搜索引擎200无法响应于用户查询产生适当的结果时评估和细化来自用户计算机10和用户浏览器12的用户查询。通常,当生成结果时,搜索引擎200维护所遍历的网站,诸如网站30的索引。所创建的索引220可以基于出现在所遍历的网站30中的关键词。
图3示出了依照本发明的一个实施例的查询细化组件300的进一步细节。查询细化组件300可包括结果评估机制310、子查询确定机制320、子查询搜索机制330以及结果输出组件340。结果评估机制310的一个实施例在图4中进一步示出。结果评估机制310可包括相关度确定组件312以及可调整阈值指示器314。相关度确定组件312可确定为用户输入查询所检索的结果是否相关,和/或产生的结果数量是否足够。相关度确定组件312可访问可调整阈值指示器314以作出这一确定。例如,可调整阈值指示器314可储存预设的阈值结果数,诸如10个结果,和/或预设的相关度指示器或得分阈值。相关度确定组件312可基于诸如点击通过率等可跟踪相关度因素来评估相关度。存在用于基于用户行为模式来确定相关度的有关技术。相关度确定组件312可实现用于确定相关度的任何已知技术。
如果用户输入查询不产生满足预定阈值的结果,则结果评估机制310可通知子查询确定机制从输入查询创建子查询。子查询确定机制320将用户输入查询剖析成单独的子查询。子查询搜索机制然后可搜索索引220,或提示搜索引擎200在索引220中搜索匹配的结果。产生的结果可再一次由结果评估机制310在转发到结果输出组件340以供输出到用户计算机10之前评估。
子查询确定机制320可通过实现同义词典以提供同义词来另外补充其替换子查询。通常,由用户输入的相可以用替换同义词来索引。因此,在子查询确定机制320内提供同义词典可增强结果的相关度。
结果评估机制310可在接收到为每一子查询返回的结果之后捕捉前面的结果的相关度,例如前三个结果的相关度,并可另外对查询的结果数量进行计数。结果输出组件340随后可显示搜索的所有子查询以及所示的结果数量,或者可替换地显示具有高于预设阈值的相关度索引的查询。
作为一个示例,如果输入查询是“mini blue ipod”(迷你型蓝色的ipod),且结果评估机制310确定从该多词查询产生的结果不是适当的,则查询细化组件300可通过使用子查询确定机制320、子查询搜索介质330和结果输出组件340将具有所接收结果数量的替换查询输出到UI。例如,响应于对于“blue mini ipod”(蓝色的迷你型ipod)的用户查询,除对输入查询“blue mini ipod”的结果之外,结果输出组件340可输出以下“You can try″blue ipod″~50k results or″Mini Ipod″~15k results”(你可以尝试“blue ipod”,大约有50000个结果,或者“Mini Ipod”,大约有15000个结果)这一示例示出替换子查询以及由每一替换子查询产生的结果数量。子查询确定机制320将用户输入查询“blue mini ipod”剖析成“blue ipod”和“mini ipod”。子查询确定机制320不选择短语“blue mini”,因为由两个形容词组成的短语的结果的相关度可能比上述两个短语的相关度要低得多,在上述两个短语中,其每一个都包括一个名词和一个形容词。
或者,结果输出组件340可产生附加的相关度得分而非结果数量或者同时附加了相关度得分和结果数量的替换子查询。如上所述,触发子查询搜索和建议的值可以是可配置或可调整的。这些值可以由搜索引擎选择,并可在可调整阈值指示器314中设置。在替换实施例中,搜索引擎200可允许用户主动调整阈值。在高系统负载的情况下,查询细化组件300可被手动或自动停用。停用选项防止对查询细化组件300的使用导致对搜索引擎用户不可接受的等待时间。
搜索引擎200可确定多少人点击各种提供的选择,并基于点击数和相关度级别来调整阈值。如果用户仅点击具有较高得分的项目或结果,则系统可基于点击重设该阈值。由此,由所选择的技术确定的相关度触发对选项的显示。
上述组件可以在许多环境中使用。在一个示例性环境中,查询细化组件300可在在线购物环境中使用。例如,用户可输入诸如“Digital Camera,Price<$200,manufacturer=cannon”(数码相机,价格<$200,制造商=佳能)的查询。如果该查询返回不适当的结果集,则可实现查询细化组件300以拓宽查询,来包括例如200和250美元之间的佳能相机或由其它公司制造的200美元以下的相机。子查询确定机制320可实现系统来确定放松哪一准则。在某些情况下,放松价格可产生更多结果,且结果具有较高的相关度得分。在其它情况下,品牌或其它准则可以是要放松的适当准则。
图5是示出依照本发明的一个实施例用于查询细化的方法的流程图。该方法在步骤500开始,搜索引擎200在步骤502接收并处理输入的用户多词查询。在步骤504,查询细化组件300评估处理步骤的结果。如果结果在步骤506被认为是适当的,则搜索引擎200在步骤508显示结果。如上所述,适当性可基于所产生的结果的数量、质量或数量和质量的组合来确定。
如果结果在步骤506不被认为是适当的,则查询细化组件300在步骤510将查询划分成子查询。在步骤512,查询细化组件300处理子查询。在步骤514,查询细化组件300评估子查询处理的结果,并选择合适的结果。在步骤516,搜索引擎200显示所有选中的结果,并且该过程在步骤518结束。
尽管此处示出并详细描述了本发明的特定实施例,然而应当理解,可以对本发明作出各种改变和修改而不脱离本发明的精神和范围。此处所描述的实施例在所有方面都旨在说明性而非限制性的。本发明所属领域的技术人员可以明白替换实施例而不脱离其范围。
从以上内容可以看到,本发明较好地适用于达到上述的所有目的和目标,以及本系统和方法中明显且固有的其它优点。可以理解,某些特征和子组合是实用的,并可在不引用其它特征和子组合的情况下使用。这是所构想的,且落入所附权利要求书的范围之内。
权利要求
1.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法,所述方法包括在所述搜索引擎内实现用于评估所述初始搜索结果的适当性的结果评估机制;如果所述初始搜索结果被所述结果评估机制认为是不适当的,则制定至少一个替换查询;以及显示包括所述初始搜索结果以及任何制定的替换查询的清单的结果信息。
2.如权利要求1所述的方法,其特征在于,实现所述结果评估机制包括评估所述初始结果的数量和相关度中的至少一个。
3.如权利要求1所述的方法,其特征在于,制定至少一个替换查询包括从所述多词用户查询中制定至少一个子查询。
4.如权利要求3所述的方法,其特征在于,还包括制定多个子查询。
5.如权利要求4所述的方法,其特征在于,还包括确定子查询结果的数量和相关度中的至少一个。
6.如权利要求5所述的方法,其特征在于,还包括显示所述子查询结果的数量和相关度中的至少一个。
7.如权利要求1所述的方法,其特征在于,还包括如果所述初始搜索结果落在相关度和数量阈值之一以下,则制定所述至少一个查询。
8.如权利要求7所述的方法,其特征在于,还包括提供用于触发所述至少一个替换查询的制定的可调整阈值。
9.如权利要求1所述的方法,其特征在于,还包括在高使用率周期期间消除所述替换查询的制定。
10.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法,所述方法包括将所述多词用户查询剖析成多个子查询;通过确定子查询结果的数量和子查询结果的相关度中的一个来确定所述多个子查询的有效性;以及显示所述初始搜索结果。
11.如权利要求10所述的方法,其特征在于,还包括显示所述子查询和所确定的子查询的有效性。
12.如权利要求10所述的方法,其特征在于,还包括仅显示具有超过预先选择的阈值的确定的有效性值的子查询。
13.如权利要求10所述的方法,其特征在于,还包括通过评估所述初始搜索结果的数量和相关度中的一个来评估所述初始搜索结果的有效性。
14.如权利要求13所述的方法,其特征在于,还包括如果所述初始搜索结果落在相关度和数量阈值中的一个以下,则剖析所述多词查询。
15.如权利要求14所述的方法,其特征在于,还包括显示所述子查询结果的数量和相关度中的至少一个。
16.如权利要求14所述的方法,其特征在于,还包括提供用于触发所述多词查询的剖析的可调整阈值。
17.一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的系统,所述系统包括所述搜索引擎内用于评估所述初始搜索结果的适当性的结果评估机制;用于在所述初始搜索结果被所述结果评估机制评估为不适当时制定替换查询的替换查询确定机制;以及用于输出所述替换查询以及所述初始搜索结果以供显示的结果输出组件。
18.如权利要求17所述的系统,其特征在于,所述结果评估机制包括用于评估所述初始结果的数量和相关度的至少一个的机制。
19.如权利要求17所述的系统,其特征在于,所述替换查询制定机制从所述多词用户查询制定至少一个子查询。
20.如权利要求19所述的系统,其特征在于,所述子查询评估机制包括用于确定子查询结果的数量和相关度中的至少一个的组件。
全文摘要
提供了一种用于响应于多词用户查询自动增强由搜索引擎产生的初始搜索结果的方法和系统。该方法可包括在搜索引擎内实现用于评估初始搜索结果的适当性的结果评估机制。该方法还可包括如果初始搜索结果被结果评估机制认为是不适当的,则制定至少一个替换查询,如子查询。该方法还可包括显示包括初始搜索结果和任何制定的替换查询的清单的结果信息。
文档编号G06F17/30GK1811763SQ20051010738
公开日2006年8月2日 申请日期2005年12月26日 优先权日2005年1月25日
发明者E·B·沃森 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1