对用于进行由一组无层次话题指导的搜索的附连的用户创建和分级及其用户界面的制作方法

文档序号:6657105阅读:172来源:国知局
专利名称:对用于进行由一组无层次话题指导的搜索的附连的用户创建和分级及其用户界面的制作方法
相关专利申请本发明要求2004年9月10日提交的发明人为Palmon等人的题为USERCREATING AND RATING OF ATTACHMENTS FOR CONDUCTING A SEARCHDIRECTED BY A HIERARCHY-FREE SET OF TOPICS,AND A USERINTERFACE THEREFOR(为进行由一组无层次话题指示的搜索对附件进行用户创建和分级及其用户界面)的美国临时专利申请第60/609,215号的优先权。该临时专利申请的内容通过引用结合于此。
背景本发明涉及搜索信息,例如在因特网上搜索信息。更具体而言,本发明涉及搜索由诸如关键字等一组话题指导的信息,其中该组话题不必要是分层的,并且其中在任何特定的搜索期间,在进行中创建任何话题搜索分层结构。
搜索可能位于本地或可能分布在网络或互联网中,甚至分布在因特网上的信息是众所周知的。例如,Google和Yahoo已成为在因特网上搜索信息的同义词。这类搜索的结果是到万维网(“Web”)上的网页的一组有序的URL或其它信息项。
通过向每一信息项附加类别或关键词(此处称为话题)来对信息分类也是众所周知的。例如Yahoo一开始是允许人们按照这些话题的引导来搜索的Web目录。这一现有技术的分类是明确地分层的,这表现在话题具有子话题等等,使得该话题集合可被构造成树结构或树图的形式。这一分层分类的一个问题是一旦选中了第一个话题,唯一可用于进一步搜索的子话题是该第一个话题的那些子话题。这可能会导致遗漏某些结果,或不能使用分类来得到良好的指导。
因此,用严格的分层结构来构造话题可能会导致不成功的搜索。
如何将搜索结果自动归类到一组分层话题中的一个话题也是众所周知的。授予Krellenstein的美国专利5,924,090以及Northern Light搜索引擎产品(参见马萨诸塞州剑桥市Northern Light Group有限公司2004年6月15日的“Northern LightEnterprise Search Engine Overview White Paper(Northern Light企业搜索引擎综述白皮书),该文献也可在www.northernlight.com上获得)描述了这一自动化归类,但是仅仅是对应一组预定义的分层话题。然而,该组话题是以分层结构来预定义的。如果使用了一组非分层的预定义话题,则不生成话题的分层结构。然而,期望具有话题的分层结构来引导搜索。即,在选择了一个搜索词或话题之后,期望生成候选话题以进一步细化搜索而无需在话题中具有预定义的分层结构。
在没有一组已定义的话题的情况下在进行中聚集搜索结果也是众所周知的。例如,参见宾西法尼亚州匹兹堡市的Vivísimo公司制作的Vivísimo ClusteringEngineTM。这一聚集引擎在进行中自动将搜索或数据库查询结果组织成有意义的分层文件夹。该聚集引擎将一搜索结果列表变换成分类信息而无需对源文档进行任何预处理。然而,类别不是预定义的,而是从搜索结果本身中包含的单词和短语中选择的。Vivísimo的聚集引擎不使用预定义的主题;其描述是在进行中从搜索结果列表中创建的。不生成话题的分层结构。
同样参见加拿大多伦多市1999年第八届国际万维网研讨会(EighthInternational World Wide Web Conference)会议论文集第148上B.D.Davison、A.Gerasoulis、K.Kleisouris、Y.Lu、H.Seo、W.Wang和B.Wu的“DiscoWeb}ApplyingLink Analysis to Web Search”(DiscoWeb向Web搜索应用链接分析)。再参见1998年澳大利亚墨尔本的SIGIR-98,第21届ACM信息检索的研发国际研讨会(21stACM International Conference on Research and Development in Information Retrieval)会议论文集第104-111页上Krishna Bharat和Monika R.Henzinger的“Improvedalgorithms for topic distillation in a hyperlinked environment”(在有超链接的环境中对话题进行提炼的改进算法)中关于如何分析网页并根据相关性和群集来对它们排序的讨论。
由此,本领域中需要一种包括将潜在的搜索结果归类到话题下的搜索方法,其中该组话题不必要是分层的,但是要在进行中生成话题的分层结构来引导搜索。
话题引导的搜索也是众所周知的,其中在每一搜索步骤之后,提供用于进一步搜索的建议话题。例如,诸如加利福尼亚州洛杉矶市的BisRate.com等购物网站是众所周知的,它建议供进一步搜索的购物话题作为搜索的结果。然而,这些话题是预定的,且具有分层结构。例如,在BizRate.com中存在话题“Computers &Software”(计算机和软件),而在该话题下的是话题“Digital Cameras”(数码相机)。在“Digital Cameras”下的是若干话题,诸如品牌名称Canon、Kodak等、对数码相机分类的不同分辨率等等。这些话题具有分层结构。
期望提供与话题引导的搜索中所提供的同样的引导,但是其中的话题不必具有分层结构。
还需要为例如已注册的人(“用户”)等搜索者提供定义新话题以添加到话题集合、以及定义信息项和新定义的话题及先前定义的话题之间的附连的能力。
并非话题和信息项之间的所有附连都是同等相关的。例如,一个话题可以是“better”(更好),或对Web上的页面比另一话题更适用。由此,本领域中需要测量信息项和话题之间的附连的质量。
类似地,并非所有的用户都是同等可信的。由此,本领域中还需要根据可信性度量来对用户评级。
本领域中还需要为已注册用户提供个性化。例如,已注册用户可能希望使先前对话题的搜索或先前对话题的遍历被记录以供重复使用。
概述本发明的一方面是提供可用于引导搜索的话题集合,每一话题具有与例如适合该话题的网页等一个或多个信息项的附连。该话题集合不必是分层排列的。相反,对于以初始话题或搜索短语开始的特定搜索,在进行中确定用于该特定搜索的话题的分层结构。该分层搜索的每一步骤包括选择一话题或提供一搜索短语,并得到建议话题集合以供进一步搜索。在任何阶段,也提供对于迄今为止的搜索的结果,例如信息项的URL。该建议话题集合是通过分析初始搜索或搜索话题下的搜索结果的附连来生成的。本发明的一方面是建议话题包括根据一细化话题准则从多个话题中确定的一个或多个细化话题。
在一个实施例中,初始搜索页面允许用户输入搜索短语并在用户未登入的情况下登入。由此,最初,搜索者输入一搜索短语,并被呈现包括细化话题在内的建议话题集合,以及导致对输入的搜索短语的搜索的选中信息项。搜索者现在可从建议话题中选择一话题,或可选择一新的搜索短语。
在另一实施例中,预定义一初始话题集合,且该初始话题集合用于确定一初始的建议话题集合。
本发明的一方面是在某些实施例中,它向例如已通过提供注册信息来注册的搜索者等用户提供创建话题的能力。在其中预定义一初始话题集合的一种形式中,用户因而被提供了向该初始话题集合进行添加的能力。本发明的另一方面是为这类用户提供创建信息项和话题之间的附连的能力。本发明的另一方面是为这类用户提供对附连分级的能力。在一个实施例中,向用户提供使用二元分级系统对话题和信息项之间的附连进行分级的机制,该二元分级系统具有第一值(“肯定”、“肯定分级”)和不如第一值令人满意的第二值(“否定”、“否定分级”)。本发明的另一方面是一种基于用户对附连的分级对每一附连计算总体附连质量的方法。
本发明的另一方面是已注册用户可选择一个或多个话题为对该用户是“偏好”或“最爱”的。向该用户呈现与呈现给另一搜索者的不同的搜索结果的视图。在一个实施例中,所建议的用于进一步搜索的话题按照被选为最爱的话题出现在其它话题之前的顺序来呈现。
本发明的另一方面是例如细化话题等所建议的用于进一步搜索的话题按照根据一细化话题评级方法确定的顺序来呈现。在一个实施例中,该评级方法依赖于系统的已注册用户如何来为与对每一潜在细化话题的搜索结果的附连分级,特别是根据所计算的潜在细化话题和搜索结果的信息项之间的附连的总体附连质量来分级。
本发明的又一方面是一种例如存储机制等用于储存数据结构的承载介质,该数据结构包括储存该话题集合的用户数据结构、被配置成储存该话题集合的话题数据结构(话题不必是分层构造的)、以及被配置成储存话题和例如网页等信息项之间的附连的附连数据结构。这些数据结构是主数据结构的一部分。在一个实施例中,主数据结构采用关系型数据库表的集合的形式,而话题数据结构、用户数据结构和附连数据结构各自是数据库的一张表。
附图简述

图1示出了耦合到诸如因特网或内联网等网络的客户机系统并包括本发明的一个实施例的一个实施例。
图2示出了本发明的一个方法实施例的简化流程图,它被示为客户机方活动,以及在图1的网络中的搜索服务器处发生的活动。
图3示出了在搜索服务器处实现的方法的简化流程图,包括接受搜索请求信息、确定搜索结果、以及形成网页以向搜索者显示搜索结果。
图4示出了用户提供附连信息的方法实施例400的流程图。
图5示出了初始用户界面显示的一个实施例,包括供用户输入例如电子邮件地址等用户ID的窗口、以及指示已经输入了用户信息的按钮,并且还包括供搜索者输入搜索短语的供应项(provision)。
图6示出了第二用户界面显示的一个实施例,该用户界面可在不必是用户的搜索者进行的示例性搜索的多阶段搜索的一个阶段处得到。
图7示出了第三用户界面显示的一个实施例,该用户界面可在用于图6所示的但对于已注册用户的示例性搜索的多阶段搜索的同一阶段处得到。
图8示出了包括供用户定义新话题的供应项的用户界面显示的一个实施例。
详细描述此处描述的是一种计算机程序形式的方法和搜索引擎,该计算机程序实现一种辅助搜索的方法。定义一话题集合,该话题集合不必是分层的。在搜索的任一阶段,使用该系统的人-称为搜索者-或者提供一搜索短语,或者从已提供的话题的第一子集中选择一话题。作为搜索的结果,向该搜索者提供可进行进一步搜索的话题的第二子集,且在一个实施例中,向搜索者提供迄今为止的搜索结果。
搜索者可以通过提供注册信息来向系统注册,以成为此处所称的用户。此处描述的是一种计算机程序形式的方法和搜索引擎,该方法和搜索引擎允许用户具有一可信性度量,使得例如话题以及由不同用户创建的话题与信息项之间的附连根据定义该附连的用户的可信性可具有不同的质量度量。
此处描述的主要的应用是搜索网页。然而,本发明不限于这一应用。一般而言,本发明的一方面是搜索“信息的项”,也称为“内容元素”和“信息项”。由此,在此处最多描述的实施例中,这些信息项是网页。在另一实施例中,这些是出版物或文档,而在又一实施例中,这些信息项是驻留在数据库中的数据元素。也可构想其它应用和组合的应用。在此处的描述中,每一信息项无论是网页还是其它,都可被假定为具有描述其例如在计算机网络中、本地计算机上、互联网中、因特网中或别处的位置的统一资源定位符URL。由此,不失一般性,术语URL此处将用于指代信息项。
由此,存在可将URL附连到其上的一话题集合。在一个实施例中,该话题集合是预定义的。在另一实施例中,话题可由已注册用户添加到该话题集合中以创建更大的话题集合。该话题集合不必具有分层结构,且在此处的描述中,假定该话题集合没有分层结构。
客户机-服务器计算机网络本发明较佳地,但不一定要在客户机-服务器网络中,即在分布式计算机系统上实现。包括本发明的一个实施例的一个示例性客户机-服务器环境在图1中示出。示例性客户机101经由网络105连接到示例性Web服务器103,并经由网络105连接到搜索服务器151。为说明起见,网络105是因特网。然而,网络105可以是专用网络(内联网)、互联网、外联网或用于提供网络连接的任何其它已知的机制。尽管仅示出了Web服务器103,但Web服务器103可以是可由诸如客户机101等客户机访问的多个服务器之一。Web服务器也可由示为搜索服务器151的搜索服务器访问。
诸如客户机101等示例性客户机器通常包括至少一个处理器107、存储器子系统117、显示子系统119、键盘115、诸如鼠标或另一输入设备等定点和选择设备123(所有这些输入设备总的示为123)、本地存储109以及将处理器系统耦合到网络105的网络接口(NIC)113的处理系统。客户机的处理系统的各元件经由总线子系统111耦合在一起,该总线子系统为简明起见被示为单根总线。客户机可包括比已知的更多或更少的组件。
诸如搜索服务器151等示例性搜索服务器包括至少一个处理器157、存储器子系统167、显示子系统169、键盘165、本地存储159、以及将处理器系统耦合到网络105的NIC 162的处理系统。服务器151的处理系统的各元件经由总线子系统161耦合在一起,该总线子系统为简明起见被示为单根总线。搜索服务器可包括比已知的更多或更少的组件。
诸如Web服务器103等示例性Web服务器也包括图1中未详细示出的处理系统。Web服务器储存如所公知的各自由URL标识的网页。一种这样的网页被示为页面131。
客户机101包括图1中示为在存储器117中的浏览器应用程序121,然而本领域的技术人员可以理解,即使在浏览器正在操作中,也并非浏览器的所有指令都同时在存储器中。本描述中假定的用户界面被实现为使用浏览器应用程序121显示在客户机的显示器119上的页面。
搜索服务器151包括图1示为在存储器167中的搜索引擎应用程序163。搜索引擎包括本发明的各方面,即实现本发明的一个实施例的一组指令,然而本领域的技术人员可以理解,并非搜索引擎163的所有指令都同时在存储器中。搜索服务器151也可以包括图1中示为161的一个或多个其它程序。
此外,尽管图1示出了搜索引擎163在搜索服务器151中操作,但是本发明的其它实施例不必且在许多情况下也不在一个服务器上操作,而是可在耦合到所示的搜索服务器,例如经由因特网耦合到服务器151,或经由局域网耦合到服务器151的某一其它处理器上操作。本发明的若干方法实施例还可在全部经由因特网或本地网耦合的若干位置上操作。此外,互联网上的处理器中的搜索引擎可将至少一个任务分配给各个处理器,使得本发明的某些方面可在至少一个计算机系统上远程地操作,甚至在(多个)计算机系统上并行操作。本领域的技术人员可以清楚如何将此处的描述修改为在以分布式方式实现。
本发明的若干方法也可以在全部都经由因特网或本地网耦合的若干位置上操作。此外,因特网上的处理器中的搜索引擎可将至少一个任务分配给各处理器,使得本发明的某些方面可以在至少一个计算机系统上远程地操作,甚至在计算机系统上并行地操作。本领域的技术人员可以清楚如何将此处的描述修改为以分布式方式来实现。
对搜索短语的Web搜索例如在因特网上搜索网页等搜索是公知的。Yahoo、Google等都运行这样的搜索。为简明起见,假定这一搜索使用了索引,且一个这样的索引171被示为在搜索服务器的存储159中。该搜索引擎被假定为包括执行对一个或多个搜索词的Web搜索、提供例如按“相关性得分”排序的结果的元素,且这些搜索元素被假定是已知的。例如,参见Ricardo Baeza-Yates、Berthier Ribiero-Neto、Berthier Ribeiro-Neto的“Modem Information retrieval”(现代信息检索),Addison-Wesley,1999;C.J.vanRijsbergen的“Geometry of Information Retrieval”(信息检索的几何学),英国,剑桥剑桥大学出版社,2004;或者C.J.van Rijsbergen的Information Retrieval(信息检索)第2版,伦敦,Butterworths,1979。在一个实施例中,对一个或多个搜索词进行搜索的搜索部分是例如使用诸如Google或Yahoo的服务在搜索服务器151远程实现的。在Web搜索中搜索的搜索词的集合可以是单词、单词集合、诸如搜索词的布尔表达式等单词集合的组合或其等效物。术语“搜索短语”此处用于表示搜索的每一和所有这样的项。此外,可在多步搜索期间输入多个搜索短语。在这一情况下,搜索短语是期望的组合,例如搜索短语的并集/逻辑和。
搜索者和用户使用搜索方法的人被称为搜索者。这一搜索者可以已向搜索服务器注册或未注册。例如通过提供注册信息已向系统注册的人此处被称为用户。用户在一个实施例中由电子邮件地址来标识,而在另一实施例中由唯一用户名来标识。用户标识符此处被表示为UserID。
用户集合,即已注册搜索者的集合由搜索服务器151维护,且被示为搜索服务器151的存储159中的用户数据结构179。数据结构179中的每一元素表示一用户。
在一个实施例中,该用户数据结构是驻留在搜索服务器151的存储159中的主数据结构177的一部分。在一个特定实施例中,主数据结构177采用了包括表集合的关系型数据库的形式。在这一实施例中,用户数据结构179是主数据结构177的一张表。
话题本发明使用了话题集合,在图1中示为驻留在搜索服务器151的存储159中的主数据结构177的话题数据结构173。每一话题是话题数据结构173中的一个元素。话题不必要是分层构造的,且本发明的一个发明性方面实现了由非分层构造的话题集合引导的搜索。每一话题被附连到形成可搜索项的整体的URL集合中的至少一个URL。由此,附连意味着URL和话题之间的关联。每一附连至少由<URL,topic(话题)>二元组来定义。如以下进一步描述的,用户可创建附连,且在这一情况下,每一附连至少由三元组<UserID,<URL,topic>>来定义,其中UserID是用户标识符。在其中数据结构177采用关系型数据库的表集合的形式的实施例中,话题数据结构是表173。附连在图1中示为作为数据结构177的一部分的附连数据结构175。在其中主数据结构包括关系型数据库的表集合的实施例中,附连数据结构是附连表175。
尽管话题在表173中不是分层构造的,但本发明的一方面是在进行中生成用于特定搜索的分层结构作为搜索者选择话题和/或搜索词的结果。
客户机方和服务器方操作现在呈现由搜索者在进行搜索的客户机处操作的一个方法实施例。搜索在搜索服务器方操作。
图2示出了本发明的一个方法实施例200,它示出了在客户机方和服务器方发生了什么。在客户机方,搜索者在201处调用浏览器并向搜索服务器151请求搜索页面以在客户机101的显示器119上显示。这例如通过向客户机指示使得搜索服务器151为搜索者供应起始页面的网站来完成。在搜索服务器方,在203处,搜索引擎163提供包括供应项的初始搜索页面以供搜索者输入搜索短语。
在一个实施例中,还为作为用户的搜索者,即已提供了注册信息的搜索者在205处显示的初始页面上提供供应项,以通过在207处提供用户名和口令来登录到系统。在这一实施例中,也为非用户搜索者提供供应项,以通过向系统提供注册信息向系统注册来成为用户,或选择继续作为非用户。
在一种变体中,该初始搜索页面还包括向搜索者呈现的话题集合的一初始子集,且带有供搜索者选择所呈现的话题中的任一个的供应项。在一个实施例中,该初始子集被预定义为要呈现给任何搜索者的话题的初始子集。在另一实施例中,该初始子集是用户专用的。例如,在一种形式中,该用户专用初始集合是根据例如在用户注册期间输入的属性等属性来预定义的。在一种形式中,作为替代或除此之外,特定用户可修改该预定义的初始子集以形成个性化的用户专用子集以供初始显示。用户集合中的一个用户可通过定义新话题和/或话题和信息项之间的新附连来向话题的通用初始子集或用户专用初始子集进行添加。或者,除此之外,该用户专用初始集合是根据用户先前的活动来计算的。在一个实施例中,用户表179因而包括关于每一用户的个性化话题子集的信息。在另一实施例中,话题表173对每一话题都包括声明了“所有权”的每一用户的名字。
在客户机方,客户机101接收该初始页面,且Web浏览器在显示器119上显示该初始页面。用户可在207处输入正确的用户名和口令(统称为“用户ID”)。
如果用户成功地输入了正确的用户名和口令(见分支208),则客户机在209处将用户ID发送到服务器151。搜索引擎163在211处接收该信息、在表179中的用户集合中查找该用户ID(此处表示为UserID)以授权用户、并在假定成功授权的情况下在211处供应新的初始页面。在一个实施例中,该初始页面包括个性化的,例如由用户选择的或为用户选择的话题的初始子集。
在客户机方,在213处,在显示器119上向用户显示带有个性化的话题子集的新初始页面,以及供用户选择话题之一的供应项,例如通过点击话题的显示,或通过用户输入搜索短语并引起搜索,例如通过按下初始页面上标记为搜索的按钮。
在本讨论的其余部分中,搜索者可以是用户,或者作为分支208的结果,可以是非注册搜索者。
由此,在为用户提供话题的情况下,客户机101在215处等待搜索者选择话题或输入搜索短语。所选择的话题和任何搜索短语输入此处被称为“搜索请求信息”。一旦提供了搜索请求信息,则在217处,客户机将该搜索请求信息发送给搜索服务器151。
在搜索服务器151处,在219处,接收搜索请求信息,并且搜索引擎在219处基于该搜索请求信息生成结果。如将在下文中更详细描述的,本发明的一方面是在219处生成的搜索结果包括根据一个或多个搜索准则(见下文)满足该搜索请求信息的一个或多个URL,并且还包括一个或多个建议话题集合,搜索者可选择这些建议话题,使得搜索者对任何建议话题的选择将进一步指导搜索。建议话题的生成在下文更详细描述。
在搜索服务器处继续,219还包括生成并供应包含搜索结果的新页面,包括建议话题,并且还包括迄今为止选择的任何话题。
在客户机101处,在221处,接收所供应的页面并向搜索者显示。搜索者现在可继续搜索。客户机方过程因此返回到215,在那里客户机101等待搜索者选择话题,例如选择建议话题之一作为另一话题或选择先前选择的话题,或者等待搜索者输入新的搜索短语,或者等待搜索者选择所显示的URL之一以供进一步显示。
注意,图2的流程图不包括诸如搜索者结束该过程、用户登出、非注册搜索者注册等细节。本领域的技术人员可以清楚,这些特征可被包括在内,且本领域的技术人员还可以清楚如何扩展该流程图以包括这些特征。此外,图2的流程图不包括关于如何接收网页、如何生成网页、以及本领域的技术人员同样已知的其它方面的细节。
因此,可通过继续215、217、219和221来继续分层搜索,这些步骤包括在客户机方请求和提供搜索请求信息、然后在搜索服务器方生成针对该搜索请求信息的结果以及包含该结果的网页、然后在客户机方显示回这些结果。每一这样的循环以分层的方式进行进一步的搜索。
注意,当显示URL时,例如作为对搜索请求信息的搜索的结果来显示时,每一URL可用各种形式来显示,包括内容摘要,这些形式当今在诸如加利福尼亚州的Mountain View市的Google公司所运作的搜索引擎中是常见的。点击URL向搜索者或用户提供网页的显示。
在一个实施例中,在219处供应并在221处向搜索者显示的结果页面包括●按序的迄今为止选择的每一话题以及迄今为止输入的每一搜索短语。
●建议话题集合。
●搜索短语或当前短语以及先前包括的短语。
●迄今为止选择的话题下的搜索短语的URL。
一个实施例允许用户,即已注册搜索者定义最爱话题的集合。在这一实施例中,在219处供应并在221处向搜索者显示的结果页面还包括用户最爱话题的集合。
搜索话题路径和搜索准则搜索可以是分层的,这表现在搜索可通过搜索者选择一个话题,然后在下一次请求一页面、另一话题等来遍历话题集合。例如,通过选择搜索话题A,将向搜索者示出话题A下,即附连到话题A的结果集合。通过现在选择第二个话题,如话题B,搜索者可以看到来自先前示出的结果内的附连到话题B,由此也附连到话题A的结果。由此,话题的分层结构是为搜索者在进行中生成的。搜索话题路径意味着在特定搜索者进行的特定搜索期间选择的话题集合。搜索话题路径中的最后一个话题是这一遍历中最近选择的话题。在一个实施例中,搜索话题路径的顺序不是重要的,因为搜索话题路径中的任一URL具有与搜索路径中的每一个和所有话题的附连。然而,仍可向搜索者显示排序,以辅助向搜索者示出迄今为止选择的话题集合中的排序。
由此,在任一阶段,搜索请求信息包括搜索话题路径和任何搜索短语。
还要注意,在搜索中的任一点,搜索者可通过选择先前遍历的话题作为最后一个话题来缩短搜索话题路径。
例如,话题集合中的四个话题由A、B、C和D来表示。请求搜索请求信息的当前显示的页面的搜索话题路径用A>B>C>D来表示。搜索者现在可以选择搜索话题中的话题C。搜索请求信息现在包括搜索话题路径A>B>C,且新的所得的搜索页面将具有A>B>C作为搜索话题路径,且所显示的URL各自具有与话题A、B和C中的每一个的附连。
因此,搜索请求信息包括活动搜索话题路径和任何活动搜索短语。注意,搜索短语如同它是话题那样来起作用,因而此处被称为伪话题,这表现在满足针对搜索短语的一个或多个准则的任何URL都可被认为是类似于附连到该搜索短语,此处称为伪附连。由此,当存在由S表示的搜索短语以及搜索话题路径A>B>C>D时,由A>B>C>D和搜索短语S构成的搜索请求信息可被认为是搜索话题路径A>B>C>D>S,其中搜索短语S被认为是伪话题,而从搜索S中得到的URL被认为是具有与话题S的伪附连。搜索者可在搜索中输入若干搜索短语,例如S1和S2,由此创建了类似A>B>S1>C>S2的路径。在一个实施例中,这与搜索路径A>B>C>(S1.and.S2)相同。
建议话题在分层搜索中的任一阶段,该方法在219处接受搜索请求信息,该搜索请求信息包括新的或修改的搜索短语或新的或修改的搜索话题路径作为搜索者提供搜索短语或选择话题的结果。该方法在219处产生URL形式的结果,以及一个或多个建议话题集合。
注意,在一个实施例中,搜索者在215处提供新搜索请求信息包括搜索者输入或修改搜索短语,或选择一话题。在另一实施例中,搜索者在215处既可以输入/修改搜索短语也可选择一话题。
对建议话题中的任一个的进一步选择将进一步指导搜索。
在一个实施例中,建议话题集合之一是缩小搜索的话题集合(“细化话题”),使得一附加的话题被添加到最后一个搜索话题路径中。在另一实施例中,建议话题集合之一是将产生类似或相关结果的话题集合(“相关话题”),使得一备选的最后一个话题替换了先前的话题路径中的最后一个话题。在又一实施例中,搜索者可选择一相关话题来替换整个搜索路径。例如,在Microsoft Windows环境中,用户可选择替换最后一个选择的路径,或者可通过在选择期间右键点击来选择替换完整的搜索话题路径。
由此,即使话题集合中的话题不必是分层的,但仍在进行中生成话题的分层结构作为多步搜索的结果。
图3是图2的流程图中框219的简化流程图。在303处,接受搜索短语或所选择的话题,或来自搜索者的其它输入。
可以回想,搜索结果可被格式化成若干结果页面,使得搜索者或用户可请求查看另一页面,例如下一结果页面。如果其它输入是对显示已供应的搜索结果的另一页面的请求,则分支305以在321处形成所请求的例如现有搜索结果的下一页面的方法继续。该所请求的页面在313处供应。
否则,在307处,该方法确定附连到(经更新的)搜索话题路径的URL,并且确定是否存在同样“伪附连”到搜索短语的搜索短语,因为这些URL是导致对搜索短语进行搜索的URL。
用于对搜索短语进行搜索的实际搜索方法不在此处进一步描述。可使用任何已知的搜索方法。在一个实施例中,搜索是使用例如远程位置处的单独的搜索引擎对搜索服务器远程地进行的,例如由诸如Google或Yahoo等某一第三方来运行。
在309处,通过分析URL与搜索话题路径的附连来生成一个或多个建议话题集合。
一个实施例包括缩小搜索范围的话题集合作为建议话题集合之一。这些话题此处被称为“细化话题”。这些细化话题能够细化搜索。
在一个实施例中,建议话题集合之一是产生类似或相关结果的话题集合,此处称为“相关话题”。
在又一实施例中,在搜索者是已定义了最爱话题的集合的用户的情况下,提供用户最爱话题作为建议话题集合。
在该较佳实施例中,如果所有三个建议话题集合都非空,则将它们呈现给搜索者以进行进一步的搜索。即,该方法为搜索者提供细化话题集合、相似话题集合、以及在用户具有最爱话题的集合的情况下的用户最爱话题的集合。
在311处,该方法形成页面。在一个实施例中,页面包括●搜索话题路径,且带有选择其中的任何话题的供应项。
●根据细化话题排序准则排序的细化话题集合。
●根据相似话题排序准则排序的相似话题集合。
●在已具有最爱话题的集合的用户的情况下,最爱话题的集合。
●附连到搜索话题路径的URL,且如果有搜索短语,则为伪附连到该搜索短语的URL,并以根据搜索顺序准则的顺序进行。
●输入搜索短语的供应项,且如果已经有了搜索短语,则为输入一个或多个搜索短语的供应项。在搜索过程期间输入了若干搜索短语的情况下,搜索短语以所输入的搜索短语的组合的形式来示出。
●在搜索结果无法在单个页面中显示的情况下,还包括让搜索者请求下一页面的供应项。
在313处,该方法向客户机供应所得的页面。
用户交互和附连本发明的一方面是向用户,即已注册搜索者提供创建话题的能力。本发明的另一方面是向用户,即已注册搜索者提供定义从URL到现有(或新创建的)话题的附连的能力。这一附连归于用户。因此,二元组<URL,Topic>之间的附连至少是三元组<UserID,<Topic,URL>>,其中UserID是用户标识符。
因此,附连集合的表175中的元素包括数据结构177中用户表179的用户。
图4示出用户提供附连信息的方法实施例400的流程图。用户可以如此定义同一URL和多个话题之间的附连。参考图4,221与图2中的相同显示由服务器供应的带有搜索结果的页面,包括建议话题和搜索的URL。在一个实施例中,Web浏览器包括允许添加当前显示的搜索话题路径和URL之间的附连的用户专用探查器栏或其它附加面板。此上下文中的探查器栏是通常用于最爱的与诸如InternetExplorerTM(华盛顿州雷蒙德市的微软公司)等Web浏览器的附连的附加面板。
在一个实施例中,用户专用探查器栏包括添加当前页面的按钮。图4包括用户在403处选择一个页面来查看。在405处,将所请求的页面信息发送到适当的位置并在Web浏览器的主窗口上供应和显示所请求的页面。图4示出用户在407处点击探查器栏上的“添加当前页面”按钮。包括搜索话题路径和页面URL在内的用户请求在409处被发送到例如服务器151等服务器,且在服务器方,在411处,该方法接收附连信息,并通过更新数据库177中的附连集合(表175)来创建附连,包括创建URL与针对该用户的搜索话题路径中的每一话题之间的附连。
注意,在一个实施例中,搜索话题路径的排序是不重要的。即,附连到一话题路径的任何URL都具有该URL与该话题路径的话题集合中每一话题之间的附连。
在另一实施例中,附连的排序仅仅是定义了URL与一完整搜索路径的附连的特定用户的事情,且对于所有用户是不重要的。对于该特定用户,搜索路径的排序是重要的。参见下文对个性化话题视图的描述。
创建并供应一新页面,例如具有结果的用户专用页面。显示搜索结果的页面(221)。在那之后,用户可通过选择一话题或输入一搜索短语来进行进一步的搜索,或者用户可创建更多新附连。
话题创建如上所述,根据本发明的一方面,已注册用户可向话题集合添加话题,并且可添加附连到该话题的一个或多个URL。因此,在一个实施例中,预定义了一初始话题集合。在一种形式中,该集合包括来自开放目录项目(Open Directory Project,ODP)的顶层话题,ODP也称为DMOZ,它由加利福尼亚州Mountain View市的Netscape Communication公司运行。对于更多信息,参见www.dmoz.org和http://dmoz.org/about.html。
当越来越多的用户使用该系统时,话题集合通过用户创建话题来增大。在任何时刻,用户可创建话题并将一个或多个URL附连到该话题上以创建一个或多个新附连。
用于用户创建话题的系统是已知的。例如,参见上述也称为DMOZ的开放目录项目(ODP)。同样参见加利福尼亚州旧金山市的LookSmart有限公司所有、且可在www.zeal.com网站上获得的Zeal系统。
当用户创建一新话题时,该用户同时或稍后创建该新创建的话题与一个或多个URL之间的一个或多个附连。
在一个实施例中,用户专用探查器面板包括供用户用于例如通过点击该探查器面板上的“添加新话题”按钮来创建新话题的机制。图4示出用户在415处点击“添加新话题”按钮来创建一新话题。在一个实施例中,这使得一弹出窗口出现。用户然后可在该弹出窗口中输入信息。尽管在一个实施例中,该弹出窗口是本地创建的,但在图4所示的另一实施例中,该弹出窗口由服务器151供应。由此,作为用户在415处点击以创建新话题的结果,在417处将信息发送到服务器。服务器为用户构建包括供用户用于输入新话题的窗口的页面,并向用户供应话题创建页面,例如作为供用户查看的另一页面或弹出窗口。在421处,客户机处的Web浏览器显示该页面以供针对附连的话题创建。在423处,用户例如通过键入话题名称来输入话题。一个实施例包括供用户还能为复选指示用户希望将话题作为当前搜索话题路径中的最后一个话题的子话题输入的复选框的工具。见下文对子话题以及如何使用子话题例如用于为特定用户将潜在细化话题评级的进一步讨论。
在425处,将新话题的信息发送给服务器。在服务器方,在427处,该方法接收该新话题信息,并更新数据库177中的话题集合173。创建并供应包括由用户创建的话题的带结果的新页面。在221处显示搜索结果的页面。在那之后,用户可通过选择一话题或输入一搜索短语来进一步搜索,或者用户可创建更多的新附连。
当创建了类似话题集合的现有话题的话题时,在一个实施例中,系统自动查看根据接近性度量接近的现有话题名称。如果有与新创建的名称相对非常接近的至少一个名称,例如根据接近性度量比预定义的接近性阈值更接近,则向用户呈现提供相对非常接近的一个或多个名称的用户界面。请求用户指示所呈现的名称中是否有任一个可被使用,且如果是,则将该话题作为用户意指的话题。
例如,如果用户提交新话题名称“tidepool”或“tidepools”或“tide pool”或“tde pool”(蓄潮池),且在话题集合中已存在话题“tide pools”,则将向用户呈现询问“tide pools”是否可以或者用户是否想要新话题的用户界面。
本领域中已知有多种用于串的接近性的度量。一个实施例使用表示为dH的汉明(Hamming)距离作为两个文本串之间的接近性的度量。源和目标串中相同且正确放置的任何字母各自贡献距离0,而不同的任何字母各自贡献距离1。另一度量是Levenshtein距离,它被定义为将一个串变换成另一个串所需的删除、插入或替换的次数。还有已知的以例如基于用于特定语言的键盘上的位置的可能置换为基础的其它更多距离度量。例如,在英语语言键盘中,“wuick”接近“quick”因为字母“q”和“w”是相邻的。然而,在法语键盘上,“w”不在“q”的旁边。所使用的键盘类型对于客户机器而言是已知的。这一可选串接近性度量例如用于拼写检查程序中。
在一个实施例中,用户还可向话题添加所谓的“子话题”。例如,如果存在话题A,则用户可创建A的“子话题”B,表示为A>B。如果存在搜索话题路径A>B>C>D,则用户可向搜索话题路径的最低层话题D创建子话题E以创建子话题D>E。以此方式,子话题向搜索话题路径添加了一额外的话题。参考图4,在一个实施例中,在419处供应并在421处显示的话题创建弹出窗口包括供用户用于键入指示用户希望将话题作为当前搜索话题路径中的最后一个话题的子话题输入的复选按钮的工具一复选框。
与此同时,或在稍后的时候,当用户创建URL和子话题A>B之间的附连时,这创建了话题A和话题B之间的附连。注意,尽管术语“子话题”暗示了分层结构,但这一分层结构仅应用于该用户。对于所有其它搜索者,并不存在从子话题A>B中所得的话题A和B的分层结构。由此,对于特定用户,对非分层话题集合的话题储存了分层结构。这些用户专用子话题如下所述用于对潜在细分话题评级以进一步进行搜索来向用户呈现。
对附连和URL的分级除每一用户能够定义话题和附连之外,本发明的另一方面是每一用户可对URL和话题之间的附连分级,使得一般而言,附连可包括信息的四元组用户、话题、URL和附连数据结构(表)175中的分级。
在本实施例中,仅使用两种分级第一分级(“肯定”)和不如第一分级令人满意的第二分级(“否定”)。替换实施例可包括多种分级,例如0到5之间的整数,而在另一实施例中,为0到10之间的整数。
在此处所描述的两种分级的实施例中,附连作为四元组<UserID,Topic,URL,NegRate>,其中NegRate是一二进制量,对于肯定的分级它为假(值0),而对于否定的分级它为真(值1)。替换实施例使用不同的值来储存分级。
在搜索话题路径下查看的URL也可由用户积极地分级,且对URL的这一分级创建了URL和搜索话题路径中的每一话题之间的新的用户专用附连并如同它是第一附连那样对其进行了分级。
肯定分级在此处描述的两种分级的实施例中,用户通过指示附连是“被选中”来对一附连进行肯定的分级。在一种形式中,当用户创建附连时,以及当用户通过指示该附连被选中来明确地对该附连进行肯定的分级时,创建了该附连的肯定分级。
对附连进行肯定分级的一个示例是通过对URL进行肯定分级。例如,查看例如作为搜索结果附连到一个或多个话题的URL的用户可对所查看的URL中的任一个进行肯定分级。在本描述中,对URL进行这样的肯定分级被称为将该URL“选择”在“我的URL”列表中,并且也被称为将该URL标记为“最爱”URL。当用户如此对URL进行肯定分级时,在该URL和搜索的话题之间创建了带有肯定分级的新附连,如同该新附连是第一个附连一样。在一个实施例中,如果搜索已遍历了若干话题,使得搜索已动态地创建了分层结构-搜索话题路径,则在该URL和该搜索话题路径中的每一话题之间创建一附连并对其进行肯定分级,使得一次性创建多个肯定分级的附连。在一替换实施例中,仅该URL和搜索话题路径中的最后一个话题之间的附连被肯定分级。由此,只要URL被标记为最爱,就创建该URL和至少一个话题之间的新附连,其中每一这样的附连包括该特定用户,如同这是创建该附连的第一个用户一样。
在一个实施例中,标记为对特定用户“选中”的附连在针对该特定用户的视图中总是在其它附连之前。由此,本发明的一方面是为用户提供包括“我的页面”的个性化视图。
由此,可以有包括特定的<URL,Topic>二元组的若干肯定分级的附连。
否定分级在此处所描述的两种分级的实施例中,当用户明确地对一附连进行否定分级时创建该附连的否定分级。进行否定分级在此处被称为将附连分级为垃圾附连,或简称为令附连成为垃圾。
对一附连进行否定分级的一种方法是通过对例如搜索结果中的URL等URL进行否定分级。对一URL进行否定分级是例如通过将该URL标记为“垃圾”来实现的。在一个实施例中,在搜索已遍历了若干话题,使得对该特定搜索在进行中创建了分层结构时,如果搜索已遍历了若干话题,对一URL进行否定分级创建了该URL和搜索话题路径中的最后一个话题之间的新的否定分级的用户专用附连。由此,例如,假定用户在搜索路径为“Palo Alto/Hiking”时令一特定URL成为“垃圾”。在这一情况下,该特定URL与搜索路径中的任何更高层次之间的附连不被否定分级,例如,该特定URL与“Palo Alto”之间的附连不被否定分级,除非先前已对该话题作出了这样的“成为垃圾”。
注意,当一URL与任何话题之间的附连被否定分级时,该搜索话题路径的任何扩展下的任何URL被自动否定分级。由此,例如,如果用户具有子话题“PaloAlto/Hiking”且令该子话题下的特定URL“成为垃圾”,则“Palo Alto/Hiking”的任何进一步的子话题对这一用户也被标记为垃圾,例如,对子话题“PaloAlto/Hiking/Shops”的附连被否定分级。
所有权除对附连分级的人的身份的指示之外,一个实施例在附连数据库175中还包括首先创建URL和话题之间的任何附连的人的指示。这一用户被称为这一附连的“所有者”。如将在稍后描述的,可向用户分配一可信性度量,且在一个实施例中,特定用户的可信性表示由所拥有的这些附连,即首先由该用户创建的附连被系统的其它用户分级得有多好。为允许这一情况,每一附连包括关于它是对<URL,Topic>二元组创建的第一个附连的指示。
由此,在一个实施例中,数据库177的附连表175中的每一附连相关联了一信息五元组<UserID,Topic,URL,NegRate,FirstCreated>,其中FirstCreated是如果这是在Topic和URL之间创建的第一个附连则为真的指示。
用户最爱和垃圾话题及URL本发明的另一方面是用户对话题和搜索话题路径分级的能力。在一个实施例中,使用一种二元分级系统,根据该系统,每一用户具有一相关联的期望(“最爱”)话题和搜索话题路径的集合,且类似地,每一用户具有一相关联的不期望(“垃圾”)话题和搜索话题路径的集合。当然,如果用户尚未将任何话题标记为最爱或垃圾,则这些集合中的每一个可以为空。本发明的另一方面是向用户提供一种用于选择话题以及将该话题分级为最爱或垃圾的机制。在一个实施例中,例如作为搜索的结果或作为要显示的初始话题集合呈现给用户的建议话题包括被用户(先前)选择为最爱的话题,并排除被用户(先前)选为“垃圾”的任何话题。注意,如果附连到标记为垃圾的话题的一个或多个URL也附连到搜索话题路径中的其它话题,或者如果这类URL是对搜索短语的搜索的结果,则包括搜索结果的页面也将包括这类URL。
最爱URL如上所述,每一附连可以被用户进行肯定或否定的分级。由此,用户还可具有相关联(“最爱”)附连的列表。这些是用户进行肯定分级的附连。
如上所述,当用户查看一搜索结果时,本发明的一方面是该用户界面向用户提供一种将所显示的URL选为“最爱”URL的机制。如上所述,如此将URL选为最爱URL创建了该URL和搜索话题路径中的每一话题之间的肯定分级的附连。
类似地,本发明的一方面是该用户界面为用户提供一种将所显示的URL选为“垃圾”URL的机制。如上所述,如此将一URL选为垃圾URL创建了该URL和搜索话题路径中的最后一个话题之间的否定分级的附连。
在本发明的一方面,当查看话题时,用户不会看见附连到被用户标记为垃圾的任何话题的任何URL。然而,如果被标记为垃圾的附连的这类URL也附连到搜索话题路径的其它话题,或者如果它们是自由搜索查询的结果,则用户也可看见这类URL。因此,假定一URL具有与搜索话题路径否定分级的附连,因而具有与该话题集合的子集的否定分级的附连。这一URL对于该搜索话题路径的父集也将被认为是垃圾。
总体附连质量由此,如上所述,在URL和话题之间可以有多个附连,且每一这样的附连可具有一不同的分级,取决于个别用户如何对该附连分级。本发明的一方面是定义URL和话题之间的关系的总体质量度量,它反映了用户如何对URL和话题之间的附连分级。该质量度量是根据一总体附连质量计算方法来计算的,在一个实施例中,该计算方法提供了对附连进行肯定分级的用户的相对数目与对附连进行否定分级的用户的相对数目的比较。在一个实施例中,总体附连质量计算方法可由一质量计算公式来表达。
在一个实施例中,总体附连质量计算方法如下。质量度量在0和1之间。最初,向每一附连分配质量1/2。如果一个或多个用户对该附连进行了肯定分级,且没有用户对该附连进行否定分级,则该附连具有值1。如果一个或多个用户对该附连进行了肯定分级,且通常有至少一个这样的用户-定义该附连的用户,则该话题附连质量从不为0,除非仅有创建了该附连且稍后对该附连进行否定分级的用户。
一般而言,对于表示为URL1,URL2,...,URLi,...的URL整体、以及表示为A1,A2,...,Aj,...的话题集合,则URLi和Aj之间的附连表示为<i,j>。对附连<i,j>进行肯定分级的用户的个数由NumPosij表示,而对附连<i,j>进行否定分级的用户的个数由NumNegij表示。以任何方式对<i,j>对的附连分级的用户的总数由Numij表示,即,Numij=NumPosij+NumNegij。<i,j>对的附连的总体质量由Qij表示。则在一个实施例中,Qij=[1/2+1/2*(NumPosij-NumNegij)/Numij],其中*表示乘法。
<i,j>对的附连的总体质量是使得在最初,以及只要没有用户对一附连进行否定分级,该附连就具有质量度量1。
在其它替换实施例中,肯定和否定附连被不同地加权。例如,设α+和α-是用于肯定和否定附连的相对权重,其中α++α-=1。
则在另一替换实施例中,Qij=[α-+(α+*NumPosij-α-*NumNegij)/Numij]。
这在α+=α-=1/2时约简为第一替换实施例。
用户可信性和贡献指标本发明的另一方面是向每一用户分配一可信性度量。这例如提供了对附连的总体质量的替换度量,该度量依赖于用户可信性,这表现在较可信用户的分级对于附连质量比较不可信用户有更大效果。
在一个实施例中,用户的可信性度量是有多少其他用户对由用户首先创建的话题进行了肯定分级的度量。该可信性度量因此提供了对于每一用户在定义话题以及对附连分级中有多可信的指示。在又一实施例中,该可信性度量还受到贡献指标的影响,该贡献指标指示,在用户为系统创建的原始附连的个数方面,用户对系统贡献了多少。
对于任何用户,用户UserID为系统创建的附连的个数,即,对用户UserID,其中UserID是该用户且对其FirstCreated为真的附连的个数由NumCreatedUserID表示。
设Qk,k=1,2,...,NumCreatedUserID是首先由用户UserID创建的附连的相应质量。
在第一实施例中,定义表示为RawCredUserID的用户UserID的“原始”可信性,作为由用户提供给系统的附连的平均质量。即RawCredUserID=(∑kQk)/NumCreatedUserID。
理想的是用户贡献指标考虑到用户创建的附连的个数,无论它是作为第一个附连创建的,还是通过将附连分级为肯定或否定来创建的。
贡献指标的一种形式如下在贡献方面为百分之十到百分之九十的所有用户贡献的每一用户贡献的平均附连数,即除其NumUserID在前10%和后10%的那些用户之外的所有用户的平均附连数,用NumCreatedAve来表示。
对于一特定用户,例如用户UserID,将用户定义的附连数用NumCreatedUserID来表示。如果一用户贡献了至少NumAttachAve个附连,设该用户具有高贡献指标,例如“全”贡献指标。如果该用户贡献了少于平均的每一用户的贡献,则该贡献指标“缓慢”减小。在一种形式中,贡献指标呈对数地减少。
用户的贡献指标用ContrUserID来表示。则在一个实施例中,ContrUserID=log[min(NumCreatedUserID,NumCreatedAve)]/log[NumCreatedAve]。
在一个实施例中,用户的总体可信性是该用户的可信性用用户的贡献指标来加权。用户的总体可信性用CredUserID来表示,它包括用户的附连是如何被分级的以及用户的相对贡献两者。则CredUserID=RawCredUserID*ContrUserID=RawCredUserID*log[min(NumCreatedUserID,NumCreatedAve)]/log[NumCreatedAve],使得如果用户贡献了多于平均的每一用户的贡献,则用户的贡献指标与用户的原始可信性相关,而如果用户具有与平均相同或更少的贡献,则用户的贡献指标与用户的原始可信性按相对贡献数呈对数地加权相关。
在一个实施例中,用户可信性度量固有地为0和1之间的数。
确定在搜索时要显示的“细化”话题和“相似”话题现在作为示例来描述对细化和相似话题的确定。在该示例中,对其正进行搜索的搜索短语用S表示。搜索话题路径用P表示。例如,假定用户运行对于搜索短语S的搜索且该搜索被细化到在话题A下然后在话题B下。则P=A>B。该搜索方法包括标识具有与搜索话题路径的附连且满足搜索短语的信息项(如果有)。这些所标识的信息项,即URL搜索结果采用URL集合的形式。将所标识的信息项的集合,即该URL集合表示为{S:P},这表示“伪附连”到搜索短语S(可以为空)以及附连到搜索话题路径P,即附连到搜索话题路径P中的所有话题的URL。空搜索短语S意味着URL搜索结果是与搜索话题路径中的每一话题附连的所有URL。P=A>B例如意味着集合{S:P}中P=A>B的每一URL具有与搜索话题路径中的每一话题,例如与话题A和话题B的至少一个附连。
确定细化话题集合细化话题是根据一细化话题准则使用一细化选择方法来确定的。在一个实施例中,细化话题准则可以是个别准则的组合。本发明不限于任何一种细化话题准则和相关联的细化选择方法。在一个实施例中,根据第一细化话题准则和相关联的细化选择方法,潜在细化话题是具有与所标识的信息项中的至少一个,例如与{S:P}中的至少一个URL的附连的话题。由此,如果P=A>B,则如果{S:A>B>C}不为空,C是{S:P}的一个细化话题。
细化选择方法选择潜在细化话题。本发明的另一方面是该细化选择方法包括对潜在细化话题评级的细化评级方法。这一细化话题评级方法用于确定两个潜在细化话题中的哪一个是较好的细化话题。在一个实施例中,细化话题例如在供应给搜索者的页面中以根据细化评级的顺序来呈现。
一种,即第一细化评级方法对每一潜在细化话题确定一细化度量,作为{S:P}中与潜在话题附连的成员的个数,该细化度量作为{S:P}的大小的百分比,{S:P}的大小表示为|{S:P}|,且是{S:P}中的URL的个数。根据该第一评级方法实施例,最佳潜在细化话题是其细化度量最接近50%的细化话题。其细化度量为50%的细化话题将结果分成两个相等大小的URL集合。下一最佳细化话题是其细化度量是最接近50%的下一度量的细化话题,依此类推。
第一种细化评级方法仅列出一个URL与一个话题的任何附连一次。由此,话题和URL之间的所有附连都被计数一次。在另一实施例中,提供一质量度量作为每一附连的质量的度量。在一种形式中,在URL和话题之间可以有一个以上附连,例如通过用户作出可能已经存在的附连。见下文对用户添加附连的描述。所使用的一个质量度量是与同一URL、话题对之间的附连的个数成正比的附连的质量度量。
第二种评级方法考虑到系统用户所作出的附连分级。可以回想本发明的一方面是提供URL和话题之间的附连的总体质量度量。该第二种评级方法包括对每一潜在的细化话题,确定作为该潜在话题与{S:P}中的任何成员的所有附连的总质量之和的细化度量,作为一个比例,如{S:P}的所有附连的总质量度量的百分比。根据该第二评级方法实施例,最佳潜在细化话题是其细化度量最接近50%的细化话题。下一最佳的细化话题是其细化度量是下一最接近50%的细化度量的细化话题,依此类推。
在一个实施例中,显示、按字母表顺序或以其它方式排序前10个最佳(或某一其它预选数目)细化话题,其中任何同样是用户最爱话题的细化话题以某种加亮的方式来显示。
根据又一实施例,使用了类似于第一方法的第三种评级方法,它也根据{S:P}中与潜在细化话题附连的URL的个数与URL结果的个数({S:P}的大小),一般是结果中信息项的个数之比,为每一潜在细化话题确定一细化度量。根据该第三种评级方法,细化度量是1)与潜在细化话题附连的所标识的信息项的个数与{S:P}中URL的个数之比,以及2){S:P}中不与潜在细化话题附连的URL的个数与{S:P}中URL的个数之比的平方和。该第三种评级方法与细化度量反向地为潜在话题评级。最佳潜在细化话题是具有最小细化度量的细化话题,下一最佳细化话题是具有下一最低细化度量的细化话题,依此类推。
根据再一实施例,使用类似于第二种方法的第四种评级方法,它也根据URL结果与潜在细化话题的附连的质量度量之和与涉及URL结果的附连的质量之和之比来为每一潜在细化话题确定一细化度量。根据该第三种评级方法,细化度量是1)从{S:P},即结果中的信息项与潜在细化话题的所有附连的总体质量度量之和与所标识的信息项的个数之比,以及2)从结果,即{S:P}与除潜在细化话题之外的话题的所有附连的总体质量度量之和与来自{S:P}的所有附连的总体质量度量之和之比的平方和。该第四种评级方法与细化度量反向地为潜在话题评级。最佳潜在细化话题是具有最小细化度量的细化话题,下一最佳细化话题是具有下一最低细化度量的细化话题,依此类推。
在一个实施例中,在输入了搜索短语,且也存在精确地匹配该搜索短语的话题的情况下,结果如同该话题被选中一样来呈现。在另一实施例中,结果也将该话题呈现为细化话题,在一种形式中,将其呈现为第一细化话题,即使根据细化话题评级方法该话题并不是“最佳”细化话题。
如先前所描述的,对已注册搜索者(用户)还显示该用户的最爱话题。如果细化话题中的任一个也在用户的最爱话题集合中,则这一最爱的细化话题被呈现在以某一加亮方式显示的所提供的页面上,例如出现在话题旁边的优先位置,或者以另一种方法,以粗体或另外强调的显示字体出现。
当用户定义了子话题时,它是具有用于该特定用户的分层结构的一对话题,则细化话题评级方法的一个实施例使用样的子话题分层结构。例如考虑以话题B结束的搜索话题路径,并假定C和D都是潜在细化话题。根据本发明的一个实施例,如果与A>D相比更多用户具有子话题A>C,则该细化话题评级方法将C评级得比D高。
确定相似话题集合相似话题是根据一相似度话题准则来确定的。本发明不限于任一种相似度话题准则。
现在描述第一相似度话题准则。考虑话题D,并假定D具有与集合{S:P}中的多个(表示为XD)URL的附连。各自具有与话题D的肯定分级的附连的URL集合定义为{>D}。具有与D的肯定附连的URL的个数用|{>D}|来表示。如果XD≥|{S:P}|的33%且进一步如果|>D}|,即具有与话题D的肯定附连的所有URL的个数不大于XD的三倍,则话题D是{S:P}的一个细化话题。
根据对话题相似度评级的第一种方法,最佳相似话题是XD=50%且|{>D}|=2XD的相似话题。下一最佳相似话题是比率之和(XD-50%)2+((|{>D}|-2XD)/D)2最小的相似话题。
根据一个替换实施例,用于确定相似话题并对其评级的第二种方法如下。
考虑集合{S:P}。如果满足以下条件,则D是相似话题1)在话题集合中有话题E,使得{>E}包括{S:P}中的所有话题且|{>E}|不会太大,例如|{>E}|不大于|{S:P}|的三倍;2){>E}也包括在{>D}中;并且3){>D}至少是|{S:P}|的大小的一半。
根据该第二种方法,如果满足以下条件,则表示为D1的第一相似话题的评级比表示为D2的第二相似话题的评级高|{>E}-({S:P}{>D1})|<|{>E}-({S:P}{>D2})|其中“-”表示集合减法,表示并。由此,如果{<E}中附连的个数比{>D2}和{S:P}的并集中附连的个数更接近{>D1}和{S:P}的并集中附连的个数,则D1的评级比D2高。
显示本发明的另一方面是向用户显示以供搜索并作为搜索结果的用户界面。
在一个实施例中,搜索结果包括在提供了短语的情况下对搜索短语进行搜索的结果,以及选择一话题的进一步结果,但是在搜索话题路径的情况下也可以是查看与所选话题或话题集合具有附连的URL的结果。
当在搜索中显示URL时,首先以与路径反向的顺序显示与用户相关联的URL。“所选的”URL例如用相邻的星来标记。例如,如果话题路径是A>B>C,则与用户相关联且具有与C的附连的那些URL被显示在与B附连的那些URL之前,而与B附连的那些URL被显示在与A附连的那些URL之前。
在一个实施例中,具有被特定用户分级为垃圾的附连的URL完全不向该用户显示。
用户信息在一个实施例中,当用户登录到系统时,向用户提供该用户的总体可信性。在用户数据库表179中维护总体可信性度量的不同分量,例如贡献指标以及用户的原始可信性以供系统使用。
尽管是内部的,但在数据库177的用户表179中为每一用户的总体可信性维护一数值度量,例如作为由0和1之间的数字表示的度量,并且为显示的目的,使用更直观的度量。一个实施例使用了字母等级,例如字母等级集合A+、A、A-、B+、B、B-、C+、C、C-、D+、D和D-中的一个等级。在另一实施例中,使用星体系。其它替换实施例使用在视觉上提供容易理解的可信性度量的替换机制。
用户界面本发明的另一方面是用于在不必为分层的话题集合的引导下搜索URL的协作搜索引擎和搜索方法的用户界面。本发明的一方面是向搜索者呈现包括供搜索者输入搜索短语的供应项以及供搜索者例如通过提供用户ID来指示该搜索者是用户的供应项的用户界面显示。
图5示出了初始用户界面显示500。其中包括供用户输入例如作为电子邮件地址的用户ID的窗口503,以及指示用户信息已被输入的按钮505。用户界面显示500包括供不是用户的搜索者输入注册信息的供应项507。点击“Click to Register”(点击注册)507使得服务器提供一注册页面。搜索者输入注册信息。该注册信息被发送给服务器,且作为结果,修改数据库177中的用户表179。现在提供一用户专用页面并替换了初始页面500。
继续图5,初始用户界面显示500包括窗口509和按钮511形式的供搜索者输入初始搜索短语的供应项。
在另一实施例中,初始页面包括话题集合的初始子集。
用户输入一搜索短语,或者在其中话题的初始子集已被呈现在第一呈现的用户界面显示的实施例中,用户输入话题之一。结果,本发明的另一方面是向搜索者呈现第二用户界面显示,该界面显示是从用户选择搜索短语所得的,或者在话题的初始子集已被呈现在第一呈现的用户界面显示的情况下,是从用户选择话题之一所得的。第二用户界面显示包括作为对搜索短语进行搜索的结果的URL(或者对于包括最初呈现的话题子集的实施例,如果选择了话题,则是附连到话题的URL)形式的搜索结果。第二用户界面包括从话题集合中选择的帮助用户进行进一步搜索的建议话题的集合。在一种形式中,该第二子集包括根据一细化话题准则细化从话题集合中选择的搜索的一个或多个话题。在另一种形式中,该第二子集包括与作为搜索的结果的URL有关的一个或多个话题。该用户界面向搜索者提供了用于例如通过点击所呈现的话题来选择话题之一的供应项。
搜索者现在可通过提供搜索短语或通过选择建议的话题之一来继续搜索。这得到具有作为搜索的结果的新URL和新的建议话题集合,包括细化话题的新的第二用户界面。用户现在可继续。结果,对于特定搜索,为搜索者在进行中确定一话题分层结果,作为搜索者选择的话题的结果。
作为一个示例,假定搜索者对在加利福尼亚州的Half Moon Bay的徒步旅行路线感兴趣。最初,搜索者输入“Half Moon Bay”作为搜索短语。假定话题集合包括话题“Half Moon Bay”。
在一个实施例中,在输入了搜索短语,且还存在精确匹配该搜索短语的话题的情况下,结果如同该话题被选中那样来呈现。由此,由于存在精确匹配该搜索短语的话题,因此搜索结果如同搜索者选择了话题“Half Moon Bay”的搜索结果。在话题“Half Moon Bay”之下呈现URL和细化话题的集合。结果,呈现细化话题的集合以及附连到话题“Half Moon Bay”的URL的搜索结果。如可以想像的,这些包括Half Moon Bay的酒店以及与“Half Moon Bay”有关的其它信息。建议的细化话题因此可包括California(加利福尼亚州)、Accommodation(住宿)等等。假定细化话题包括话题“Things to do”(要做的事情)。还假定搜索者选择该话题作为下一话题,则再一次呈现URL集合和建议话题的集合,包括细化话题。假定细化话题包括话题“Whale watching”(鲸鱼观赏)、“Bird Watching”(鸟类观赏)、“Fishing”(钓鱼)、“Hiking”(徒步旅行)等。对徒步旅行路线感兴趣的搜索者选择“Hiking”。假定作为结果,有URL和建议话题的集合,且假定建议话题之一是“Trails”(路线)。假定用户选择“Trails”。
图6示出了对该示例在该搜索阶段可能得到的第二用户界面显示600。所呈现的用户界面显示包括搜索话题路径603的指示,在此情况下为“Half MoonBay>Things to do>Hiking>Trails”。所呈现的用户界面显示还包括结果607,在此情况下为系统中总共600个URL的前三个URL。对每一结果,在显示中提供附连到该URL的标题和简短描述,使得搜索者选择(点击)所显示的结果的任一个将使由该URL定义的网页被显示。在图6的情况下,结果中URL的个数使得需要若干个页面来示出结果中的所有URL。所呈现的用户界面显示包括正在显示多页面结果中的哪一页面的指示613,并且还产生选择其它页面之一的机制以及显示下一页面的机制。如果所显示的页面是除第一个页面之外的页面,则还显示用于显示前一页面的机制。
所呈现的用户界面显示还包括细化话题集合605形式的建议话题的集合。在一个实施例中,包括图6中所示的那些的相似话题集合609也用供搜索者选择相似话题之一来替换搜索话题路径的机制来显示。在一个实施例中,还显示每一建议的话题之下的URL的个数。
所呈现的用户界面显示的一个实施例还包括供搜索者提供附加搜索短语以在搜索话题路径中搜索的机制。在图6中,这采用了其中用户可输入搜索短语的文本窗口611,以及启动搜索中的下一步的按钮615的形式。
注意,一替换实施例进一步不仅示出了系统中的搜索的结果,例如与搜索话题路径中的每一话题有至少一个附连的URL的结果,还示出了Web搜索的结果。还注意,在所示的实施例中,还显示广告链接615。在其它替换实施例中,还包括其它链接。
图6的所呈现的用户界面显示还包括供搜索者开始新搜索的机制,并且还包括如果搜索者是用户则供搜索者登入的机制。即,图6的所呈现的用户界面显示包括图5的第一呈现的用户界面显示的机制。
例如,假定用户在此阶段登入,或假定用户在早先的阶段登入,并同样到达搜索话题路径“Half Moon Bay>Things to do>Hiking>Trails”。
当用户登入时,将用户ID发送给服务器,服务器确定该潜在用户是否已注册。如果搜索者实际上是用户,则服务器提供包括用户专用信息的经修改的页面。由此,本发明的另一方面是向作为用户的搜索者呈现包括用户专用信息的第三用户界面显示的方法。
图7示出了对于本示例在搜索的这一阶段可能得到的第三用户界面显示700。所呈现的用户界面显示700包括主显示区域750和用户专用探查器栏(或其它附加窗口)760。所呈现的用户界面显示700包括对当前用户的指示719,在本示例中作为具有用户在注册期间选择的用户名的欢迎(Welcome)消息。如果所示的用户名是不同的用户,则还为用户提供了例如通过登入来指示的供应项。还提供了登出供应项79,在本示例中它在探查器栏760中,以供用户登出。
所呈现的用户界面显示的主窗口750包括图6所示的结果的修改,但是是以用户专用的方式来修改的。例如,主窗口750包括搜索话题路径指示703,在本示例中同样是“Half Moon Bay>Things to do>Hiking>Trails”。在一个实施例中,包括了向所储存的用户最爱的搜索话题路径的集合添加当前搜索话题路径的供应项,在本实施例中作为标记为“Add to My Topixa”(添加到My Topixa)的可点击对象717或类似的标志,其中在本示例中,“My Topixa”是用户的用户专用信息,诸如用户的最爱话题、肯定分级的附连以及其它用户专用信息。在一个实施例中,主窗口750还包括消息区域745,在本示例中它被示为包含消息“This topic path hasbeen added to My Topixa”(该路径已被添加到My Topixa)。这一消息可例如在用户点击可点击对象717以使当前搜索话题路径703成为最爱话题之后得到。
在一个实施例中,所呈现的第三用户界面显示700的主显示窗口750还包括URL结果701,在本实施例中,它在三个不同的呈现中。第一个呈现包括肯定分级的,例如“最爱”的结果,即,与搜索话题路径中用户“选择”要作为用户的“最爱”附连包括的话题有附连的那些URL。第二个列表743是总体结果的列表,例如,图6的列表607中所呈现的URL。在一个实施例中,没有包括用户选为“垃圾”的任何结果。即,在一个实施例中,那些“被分为垃圾”的URL不在第二列表743中示出。由此,在本示例中,总体结果的列表具有比图6的结果607少的URL。
如同图6的情况一样,结果中的URL个数使得需要若干页面来示出结果中的所有URL。所呈现的用户界面显示700的主窗口750包括正在显示多页面结果中的哪一页面的指示,并且还包括选择其它页面之一的机制、以及显示下一页面的机制。如果所显示的页面是除第一个页面之外的页面,则还显示用于选择前一页面的机制。
图7详细示出了最爱URL。对于每一结果,在显示中提供标题和简短描述,它们链接到该URL,使得搜索者选择(点击)所显示的结果中的任一个将使由该URL定义的网页被显示。在一个实施例中,还呈现首先定义该URL的附连的用户的标识符725。同样显示的还有系统对用户的可信性747。
在一个实施例中,所呈现的用户界面显示700的主窗口750在最爱结果707中包括例如复选窗口721形式的将一个或多个结果“分为垃圾”的供应项、以及用“Delete link from My Topixa”(从My Topixa中删除链接)适当标记的“junk”(分为垃圾)按钮723,其中“My Topixa”是搜索话题路径下的最爱附连的列表。复选任何结果并点击所提供的按钮723对所标记的URL与搜索话题路径的附连进行否定分级。
通过点击总体结果743在本示例页面3中选择总体结果中的第一个页面类似地产生总体结果的第一页面。在这一情况下,在一个实施例中,所呈现的用户界面显示700的主窗口750在总体结果中包括选择结果中的一个或多个的供应项,该供应项例如采用复选窗口和例如用“Add to My Topixa”或类似的注释适当标记的“addto favorites”(添加到最爱)按钮的形式。复选任何结果并点击所提供的按钮对所标记的URL与搜索话题路径的附连进行肯定分级。
在一个实施例中,所呈现的用户界面显示700的主窗口750包括在Web上搜索搜索话题路径中的词语的结果。
所呈现的用户界面显示700的主窗口750还包括细化话题集合705形式的建议话题集合。在一个实施例中,还显示每一建议话题下的URL的个数。所呈现的用户界面显示窗口750的一个实施例还包括供搜索者提供附加搜索短语以在搜索话题路径中搜索的机制。在图7中,该机制采用了其中用户可输入搜索短语的文本窗口711以及启动搜索中的下一步的按钮715的形式。
在一个实施例中,将细化话题集合连同关于建议话题中的哪一个是用户的最爱话题的指示一起呈现。在图7中,在列表705中示出了星以指示最爱的建议话题。此外,顺序是使得最爱的建议话题被呈现在其它建议话题之前的顺序。在图7所示的示例中,建议的细化话题中的三个“family trails”(家庭路线)、“long trails”(长途路线)和“nature hikes”(自然徒步)是最爱,例如先前已被该用户选为最爱。因此,图7中建议的细化话题的顺序可以且在本示例中也的确与图6的建议的细化话题605的顺序不同。
在一个实施例中,所呈现的用户界面显示700包括提供用户专用信息的用户专用探查器栏760(或类似的面板)。在一个实施例中,如果当前的搜索话题路径成为最爱,则显示该搜索话题路径731。在一个替换实施例中,即使当前的搜索话题路径并未成为最爱,也显示该搜索话题路径731。提供了用于显示和管理所有最爱搜索话题路径的可点击对象,并且提供了用于将新的搜索话题路径作为最爱搜索话题路径来添加的此处标记为“New...”(新建)727的可点击对象。
在一个实施例中,探查器栏(或类似的面板)760包括对当前搜索话题路径的用户的最爱附连的列表741。探查器栏(或类似的面板)760还包括在图7中被标记为“Add currentpage”(添加当前页面)的用于添加当前显示的搜索话题路径与主窗口750中显示的网页之间的附连的可点击对象739。由此,用户通过点击结果701之一来选择一网页。这使得该URL被提供并被显示在主窗口750中。用户现在点击可点击对象739使得信息被发送到服务器,服务器添加主窗口中显示的URL与当前显示的搜索话题路径731中的每一话题的附连。
由此,提供了供用户对所显示的搜索结果与搜索话题路径之间的任何附连的质量进行分级的机制。
在一个实施例中,所呈现的第三用户界面显示的探查器栏(或类似的面板)760包括供用户添加话题或子话题的供应项。在所示的形式中,该供应项采用了当被调用时使得服务器提供用于向当前显示的搜索话题路径,例如向搜索话题路径中的最后一个话题添加新话题或子话题的弹出页面的可点击对象737。每一新话题或子话题成为该特定用户的最爱。
图8示出了作为用户点击图7的探查器面板760中的“Add newtopic/subtopic...”(添加新话题/子话题)对象的结果而提供的弹出窗口800的一个实施例。在一个实施例中,弹出窗口800包括当前搜索话题路径的显示803,以及被示为以“Save”(保存)标记供用户输入新话题或子话题的机制,在本情况中为可填充文本窗口805和按钮807。提供了复选框809用于指示对于用户新话题是否要作为子话题添加到搜索话题路径中的最后一个话题-在所示的示例中为话题“Trails”。弹出窗口800还包括取消对话题或子话题的添加的可点击对象。
如此已描述了用于按不必为分层的话题集合的引导来进行搜索的方法。
除非另外具体规定,否则如可从以下讨论中清楚的,可以理解,在本说明书的全部讨论中利用的诸如“处理”、“计算”、“运算”、“确定”等术语指的是计算机或计算系统或类似的电子计算设备的动作和/或进程,该动作和/或进程将表示为诸如电子量等物理量的数据处理和/或变换成同样表示为物理量的其它数据。
以类似的方式,术语“处理器”可以指处理例如来自寄存器和/或存储器的电子数据以将该电子数据变换成例如可被储存在寄存器和/或存储器中的其它电子数据的任何设备或设备的一部分。“计算机”或“计算机器”或“计算平台”可包括一个或多个处理器。
此处所描述的方法在一个实施例中可由包括接受含有指令的计算机可读(也称为机器可读)代码的一个或多个处理器的机器来执行。对于此处所描述的方法中的任一种,当指令由机器执行时,该机器执行该方法。能够执行指定要由该机器采取的动作的指令集(顺序地或以其它方式)的任何机器都被包括在内。由此,一种典型的机器可用包括一个或多个处理器的典型处理系统为例。每一处理器可包括CPU、图形处理单元以及可编程DSP单元中的一个或多个。处理系统还可包括包含主RAM和/或静态RAM和/或ROM的存储器子系统。可包括总线子系统以在组件之间进行通信。如果处理系统需要显示器,则可包括这样的显示器,例如液晶显示器(LCD)或阴极射线管(CRT)显示器。如果需要手动数据输入,则处理系统还包括输入设备,例如诸如键盘等字母数字输入单元、诸如鼠标等定点控制设备等中的一个或多个。此处使用的术语存储器单元还包含诸如盘驱动器单元等存储系统。某些配置中的处理系统可包括声音输出设备以及网络接口设备。因此,存储器子系统包括承载指令的计算机可读代码(例如,软件)的承载介质,该指令用于在被处理系统执行时实现此处所描述的方法中的一种或多种。注意,当方法包括若干元素,例如若干步骤时,除非特别规定,否则并不暗示这些元素的排序。软件可驻留在硬盘内,或者也可在其被计算机系统执行期间完全或至少部分地驻留在RAM和/或处理器内。由此,存储器和处理器也构成了承载计算机可读代码的承载介质。
在替换实施例中,机器作为独立的设备来操作,或者在联网部署中,可连接到,例如联网到其它机器,在服务器-客户机网络环境中,机器可作为服务器或客户机来操作,或在对等或分布式网络环境中作为对等机器来操作。机器可以是个人计算机(PC)、图形输入板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web设备、网络路由器、交换器或网桥、或能够执行指定要由该机器采取的动作的指令集(顺序地或以其它方式)的任何机器。
注意,尽管某一(些)视图仅示出了单个处理器和承载计算机可读代码的单个存储器,但是本领域的技术人员可以理解,上述组件中的许多都被包括在内,但是未明确示出或描述以免使本发明方面晦涩。例如,尽管仅示出了单个机器,但是术语“机器”应当被认为是包括单独或联合地执行指令集(或多个指令集)以实现此处所讨论的方法中的任一种或多种的机器的任何集合。
由此,此处所描述的方法的每一种的一个实施例采用了在处理器系统,例如作为搜索服务器的一部分的一个或多个处理器上执行的计算机程序的形式。由此,如本领域的技术人员可以理解的,本发明的实施例可被具体化为方法、诸如专用装置等装置、诸如数据处理系统等装置或例如计算机程序产品等承载介质。承载介质承载了用于控制处理系统实现方法的计算机可读代码。因此,本发明的各方面可采用方法、完全硬件实施例、完全软件实施例或组合了软件和硬件方面的实施例的形式。此外,本发明可采用承载了包含在介质中的计算机可读程序代码的承载介质(例如,计算机可读存储介质上的计算机程序产品)的形式。
软件还可经由网络接口设备通过网络来发送或接收。尽管承载介质在一个示例性实施例中被示为是单个介质,但是术语“承载介质”应当被认为是包括储存一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。术语“承载介质”也应当被认为是包括能够储存、编码或承载供机器执行并使得机器实现本发明的方法中的任一种或多种的指令集的任何介质。承载介质可采用多种形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如光盘、磁盘和磁光盘。易失性介质包括诸如主存储器等动态存储器。传输介质包括同轴电缆、铜线和光纤,包括构成总线子系统的导线。传输介质还可以采用声波或光波的形式,诸如在无线电波和红外数据通信期间生成的那些波。例如,术语“承载介质”相应地应当被认为包括但不限于固态存储器、光学和磁性介质以及载波信号。
可以理解,所讨论的方法的步骤在一个实施例中由执行储存在存储中的指令(计算机可读代码)的处理系统(即,计算机)的适当处理器(或多个处理器)执行。还可以理解,本发明不限于任何特定的实现或编程技术,并且本发明可使用用于实现此处所描述的功能的任何适当的技术来实现。本发明不限于任何特定的编程语言或操作系统。
贯穿本说明书对“一个实施例”或“一实施例”的参考指的是结合该实施例描述的特定特征、结构或特性被包括在本发明的至少一个实施例中。由此,短语“在一个实施例中”或“在一实施例中”在本说明书各处的出现不必都指代同一实施例。此外,如本领域的普通技术人员从本公开内容中可以清楚的,特定的特征、结构或特性在一个或多个实施例中可用任何适当的方式来组合。
类似地,应当理解,在以上对本发明示例性实施例的描述中,为流线化本发明的公开并有助于理解各个发明性方面中的一个或多个的目的,本发明的各种特征有时候在单个实施例、附图或其描述中被分组在一起。然而,本发明公开的方法并不被解释为反映了所要求保护的本发明需要比在每一权利要求中明确所述的更多的特征的意图。相反,如所附权利要求书所反映的,各发明性方面在于少于单个上述公开的实施例的全部特征。由此,详细描述之后的权利要求书此处被明确地结合到该详细描述中,其中每一权利要求独立地作为本发明的一个单独实施例。
此外,尽管此处描述的某些实施例包括其它实施例中所包括的某些特征但不包括其它特征,但是不同实施例的特征的组合意味着落入本发明的范围之内,并形成不同的实施例,如本领域的技术人员可以理解的。例如,在所附权利要求书中,所要求保护的实施例的任一个可在任何组合中使用。
此外,此处将某些实施例描述为可由计算机系统的处理器或实现功能的其它装置实现的方法或方法元素的组合。由此,处理器连同用于实现这一方法或方法元素的必要指令一起形成了用于实现方法或方法元素的装置。此外,此处所描述的装置实施例的元件是用于实现由该元件为实现本发明的目的而执行的功能的装置的示例。
在此处所提供的描述中,陈述了众多具体细节。然而,可以理解,本发明的实施例可以在没有这些具体细节的情况下实现。在其它情况下,未示出公知的方法、结构和技术以免使对本说明书的理解晦涩。
如此处所使用的,除非另外指明,否则对序数词“第一”、 “第二”、“第三”等的使用来描述一公共对象仅指示指代了相同对象的不同实例,而不意图暗示如此描述的对象必须在时间上、空间上、排序上或以任何其它方式为给定的顺序。
此处所引用的所有出版物、专利和专利申请都通过引用结合于此。
在所附权利要求书和此处的说明书中,术语“包括”、“由……组成”或“其中包括”中的任一个是开放式术语,意味着至少包括以下元素/特征而不排除其它。由此,当在权利要求书中使用时,术语“包括”不应被解释为对之后列出的装置或元素或步骤是限制性的。例如,表达方法“设备包括A和B”的范围不应限于该设备仅包括元素A和B。此处所使用的术语“包含”或“其中包含”或“它包含”中的任一个也是开放式术语,它们也意味着至少包括该术语之后的元素/特征而不排除其它。由此,“包含”与“包括”同义并意味着“包括”。
类似地,要注意,当在权利要求书中使用时,术语“耦合”不应被解释为仅限于直接连接。可使用术语“耦合”和“连接”及其派生词。应当理解,这些术语并不旨在是彼此的同义词。由此,表达方式“设备A耦合到设备B”的范围不应限于其中设备A的输出直接连接到设备B的输入的设备或系统。它意味着在A的输出和B的输入之间存在一条路径,该路径可以是包括其它设备或装置的路径。“耦合”可以意味着两个或更多元件或者直接物理或电接触,或者两个或更多元件不是彼此直接接触而仍共同操作或彼此交互。
由此,尽管描述了所谓的本发明的较佳实施例,但是本领域的技术人员将认识到,可在不脱离本发明的精神的前提下对其作出其它和进一步的修改,且旨在声明所有这些改变和修改都落入本发明的范围之内。例如,以上给出的任何公式仅表示可使用的过程。可向框图添加或删除功能,并且可在功能块中互换操作。可向在本发明的范围内描述的方法添加或删除步骤。
本申请的权利要求1、3和10-16被修改。权利要求45现在重新编号为权利要求59。增加了权利要求45-58和60-62。
权利要求1增加了说明书中的特征,即建议话题是细化话题、相似话题中的任一个或者既是细化话题又是相似话题。修改权利要求3和10-16以纠正打字错误和/或使权利要求变为多项从属,或更改语序。
新的权利要求45-58和60-62要求保护了所提交的申请中描述的特征。
如有任何问题或意见,请联系署名者,电话+1-510-547-3378,传真+1-510-291-2985,email:dov@inventek.com
1.一种指导由话题集合辅助的搜索的计算机实现的方法,所述话题不必具有分层结构,每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括根据由第一搜索者提供的搜索请求信息为所述第一搜索者标识所述多个信息项中的一个或多个信息项,所述搜索请求信息包括由搜索短语和所述话题集合中的一个或多个搜索话题的子集构成的组中的至少一个;从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及向所述第一搜索者提供搜索结果,所述搜索结果包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,其中,所述建议话题包括来自由以下两个集合构成的组的一个或多个话题的至少一个集合使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题的第一集合,以及使用一相似度话题选择方法根据一相似度话题准则从所述话题集合中确定的一个或多个相似话题的第二集合,使得所述第一搜索者选择所述建议话题之一将引起生成包括一新的建议话题集合的新结果,并使得在选择细化话题的情况下,为所述第一搜索者的特定搜索在进行中形成一话题分层结构。
2.如权利要求1所述的方法,其特征在于,所述话题和所述信息项之间的附连的至少某一些是由用户定义的,用户是已提供了注册信息的搜索者。
3.如权利要求2所述的方法,其特征在于,所述附连中的至少一个具有附连质量度量,所述话题和信息项之间的附连的附连质量度量是从由用户提供的分级中确定的,一特定附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量。
4.如权利要求3所述的方法,其特征在于,所述细化选择方法考虑任何潜在细化话题和所标识的信息项之间的附连的附连质量度量。
5.如权利要求1所述的方法,其特征在于,根据所述细化话题选择方法,潜在细化话题是具有与所标识的项的至少一个的附连的话题,且所述细化话题是从所述潜在细化话题中选择的。
6.如权利要求5所述的方法,其特征在于,所述细化话题选择方法包括对潜在细化话题评级以为所述细化话题确定排序的细化话题评级方法。
7.如权利要求6所述的方法,其特征在于,所述细化话题评级方法确定一细化度量,它对每一潜在细化话题确定取决于所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比的细化度量。
8.如权利要求7所述的方法,其特征在于,所述细化评级方法包括对每一潜在细化话题,确定作为所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比的细化度量,使得评级最高的潜在细化话题是其细化度量最接近表达为百分比的50%的细化话题,且下一评级最高的潜在细化话题是其细化度量是下一最接近于被表达为百分比的50%的细化话题,由此其细化度量是被表达为百分比的50%的细化话题将所标识的信息项分为两个相等大小的信息项集合。
9.如权利要求7所述的方法,其特征在于,所述细化评级方法包括对每一潜在细化话题,根据以下两项的平方和确定细化度量所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比,以及所标识的信息项中不与所述潜在细化话题附连的个数与所标识的信息项的个数之比,使得评级最高的潜在细化话题是其细化度量最小的细化话题,且下一评级最高的潜在细化话题是其细化度量为下一最小的细化话题。
10.如权利要求7所述的方法,其特征在于,所述附连中的至少一个具有附连质量度量,所述话题和信息项之间的附连的附连质量度量是从由用户提供的分级中确定的,一特定附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量,以及所述细化评级方法包括对每一潜在细化话题,根据以下两项的平方和确定细化度量所述潜在细化话题与所标识的信息项中的任一个的所有附连的总体质量之和与所标识的信息项的所有附连的总质量度量之比,以及所标识的信息项中的任一个与除所述潜在细化话题之外的任何话题之间的所有附连的总体质量之和与任何所标识的信息项的所有附连的总质量度量之比,使得评级最高的潜在细化话题是其细化度量最小的细化话题,且下一评级最高的潜在细化话题是其细化度量为下一最小的细化话题。
11.如前述权利要求中任一项所述的方法,其特征在于,每一信息项是网页。
12.如前述权利要求中任一项所述的方法,其特征在于,还包括从用户接受所述多个信息项之一与所述话题集合之一之间的新附连,用户是已提供了注册信息的搜索者。
13.如前述权利要求中任一项所述的方法,其特征在于,还包括从用户接受要添加到所述话题集合的新话题以及所述多个信息项之一与所述新话题之间的新附连,用户是已提供了注册信息的搜索者。
14.如前述权利要求中任一项所述的方法,其特征在于,所述标识一个或多个信息项包括从所述第一搜索者接受所述搜索请求信息;以及根据所接受的搜索请求信息以及一个或多个搜索准则搜索所述多个信息项以标识所述一个或多个信息项,所述搜索准则包括所标识的信息项各自具有与所接受的搜索请求信息中的每一话题的附连。
15.如前述权利要求中任一项所述的方法,其特征在于,所述提供搜索结果包括向所述第一搜索者显示所述搜索的结果,以及其中,所述第一搜索者选择所述建议话题之一引起向新搜索者显示所生成的新结果。
16.一种指导由话题集合辅助的搜索的计算机实现的方法,所述话题不必具有分层结构,所述话题集合中的每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括定义所述附连,所述对每一附连的定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义附连包括从至少一个用户接受至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连,使得所述话题集合中的每一话题具有与所述多个信息项中的至少一个信息项的至少一个附连;
根据由第一搜索者提供的搜索请求信息为所述第一搜索者标识所述多个信息项中的一个或多个信息项,所述搜索请求信息包括由搜索短语和来自所述话题集合的搜索话题构成的组中的至少一个;从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及向所述第一搜索者提供搜索结果,所述搜索结果包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,其中所述建议话题包括使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题,使得选择所述建议话题之一将生成一新的建议话题集合,使得为特定搜索在进行中形成一话题分层结构。
17.如权利要求16所述的方法,其特征在于,不同用户定义同一话题和同一信息项之间的不同附连,使得由不同用户定义的多个附连可存在于一特定话题和一特定信息项之间。
18.如权利要求17所述的方法,其特征在于,一特定话题和一特定URL之间的每一附连具有从由不同用户提供的所述特定话题和所述特定URL之间的不同附连个数确定的附连质量度量。
19.如权利要求17所述的方法,其特征在于,一特定话题与一特定URL之间的每一附连具有从由不同用户提供的分级中确定的附连质量度量,每一附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量。
20.如权利要求19所述的方法,其特征在于,对一特定附连分级的特定用户根据一二元值分级来对所述附连分级,所述二元值分级具有第一分级(“肯定”)和不如所述第一分级令人满意的第二分级(“否定”)。
21.一种方法,包括定义话题集合中的每一话题与信息项集合中的相应信息项之间的一个或多个附连,所述话题不必具有分层结构,所述对每一附连的定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义附连包括从至少一个用户接受至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连,使得所述话题集合中的每一话题具有与所述多个信息项中的至少一个信息项的至少一个附连,
其中所述话题用于由特定搜索者根据由所述特定搜索者提供的搜索请求信息在所述多个信息项中搜索一个或多个信息项,所述搜索请求信息包括所述话题集合中的至少一个话题,所述搜索包括标识具有与所述搜索请求信息中的至少一个话题的附连的至少一个或多个信息项。
22.如权利要求21所述的方法,其特征在于,还包括从用户接受要添加到所述话题集合的新话题;以及将所接受的新话题添加到所述话题集合。
23.如权利要求21所述的方法,其特征在于,预定义初始的多个话题。
24.如权利要求21所述的方法,其特征在于,第一用户定义第一话题与第一信息项之间的第一附连以及第二用户定义所述第一话题与所述第一信息项之间的附连的结果是在所述第一话题与所述第一信息项之间存在至少两个附连。
25.如权利要求24所述的方法,其特征在于,还包括从用户接受对所述话题集合中的一特定话题与一特定信息项之间的特定附连的分级,使得所述特定话题与所述特定信息项之间的多个附连可具有不同的分级。
26.如权利要求25所述的方法,其特征在于,所述分级具有两个值,即第一值(“肯定”)和不如第一值令人满意的第二值(“否定”)。
27.如权利要求25所述的方法,其特征在于,所述分级具有两个以上值。
28.如权利要求25所述的方法,其特征在于,还包括基于用户对所述特定话题与所述特定信息项之间的附连的分级,为所述特定话题和所述特定信息项之间的一个或多个附连确定一总体附连质量。
29.一种提供用于一搜索方法的用户界面的计算机实现的方法,所述搜索方法由一话题集合来辅助,所述话题不必具有分层结构,每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括引起向第一搜索者显示第一用户界面,所述用户界面允许所述搜索者输入包括由搜索短语和所述话题集合中的一个或多个搜索话题的子集构成的组中的至少一个的搜索请求信息;执行所述搜索方法,所述搜索方法包括接受所述第一搜索者输入的所述搜索请求信息;根据所接受的搜索请求信息标识所述多个信息项中的一个或多个信息项;以及从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及作为执行所述搜索方法的结果,引起向所述第一搜索者显示第二用户界面,所述第二用户界面包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,所述第二用户界面为所述第一搜索者提供了选择所述建议话题之一的能力,其中所述建议话题包括使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题,使得所述第一搜索者使用所显示的第二用户界面选择所述建议话题之一生成一新的建议话题集合,并引起向所述第一搜索者显示所述新建议话题集合中的至少某些话题,使得对所述第一搜索者的特定搜索在进行中形成一话题分层结构。
30.如权利要求29所述的方法,其特征在于,向查看者最多显示预定个数的细化话题。
31.如权利要求29所述的方法,其特征在于,所述第一用户界面和所述第二用户界面分别是第一网页和第二网页。
32.如权利要求29所述的方法,其特征在于,还包括从所述搜索者接受新的搜索请求信息;确定包括所标识的信息项集合和一个或多个建议话题的新集合的新搜索结果,所述新搜索结果是通过向所接受的新搜索请求信息应用所述一个或多个搜索准则来确定的;以及向所述搜索者呈现所述新搜索结果。
33.如权利要求32所述的方法,其特征在于,所接受的新搜索请求信息包括从先前的建议话题中选择的话题;所述新搜索结果中的信息项具有与所述从先前的建议话题中选择的话题的附连。
34.如权利要求29所述的方法,其特征在于,呈现给所述第一搜索者的建议话题包括根据与所标识的信息项有关的话题相似度准则从所述话题集合中确定的一个或多个相似话题。
35.如权利要求34所述的方法,其特征在于,所述相似话题是根据依照一相似度话题评级方法来确定的相似度评级来排序的。
36.如权利要求35所述的方法,其特征在于,最多向查看者显示预定个数的相似话题。
37.一种方法,包括
定义一话题集合用于附连到多个信息项中的一个或多个信息项,所述定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义话题包括从至少一个用户接受至少一个话题;以及将所述话题添加到所述话题集合,其中所述话题不必具有分层结构;其中每一话题用于附连到所述多个信息项中的一个或多个信息项,以及其中附连到至少一个信息项的所述话题用于由特定搜索者根据由所述特定搜索者提供的搜索请求信息来搜索所述多个信息项中的一个或多个信息项,所述搜索请求信息包括所述话题集合中的至少一个话题,所述搜索包括标识具有与所述搜索请求信息中的至少一个话题的附连的至少一个信息项。
38.如权利要求37所述的方法,其特征在于,还包括从至少一个用户接受所述话题集合中的至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连;以及对先前没有与一信息项的附连的任何话题,将所述话题添加到一个或多个话题的组,所述一个或多个话题中的每一个具有与所述多个信息项中的至少一个信息项的至少一个附连。
39.如权利要求37所述的方法,其特征在于,预定义一初始话题集合。
40.如权利要求38所述的方法,其特征在于,第一用户定义第一话题与第一信息项之间的第一附连以及第二用户定义所述第一话题与所述第一信息项之间的附连的结果是在所述第一话题与所述第一信息项之间存在至少两个附连。
41.如权利要求39所述的方法,其特征在于,还包括从用户接受对所述话题集合中一特定话题与一特定信息项之间的特定附连的分级,使得所述特定话题与所述特定信息项之间的多个附连可具有不同的分级。
42.如权利要求41所述的方法,其特征在于,所述分级具有两个值,即第一值(“肯定”)和不如所述第一值令人满意的第二值(“否定”)。
43.如权利要求41所述的方法,其特征在于,所述分级具有两个以上值。
44.如权利要求41所述的方法,其特征在于,还包括基于用户对所述特定话题与所述特定信息项之间的附连的分级对所述特定话题与所述特定信息项之间的一个或多个附连确定总体附连质量。
45.如权利要求1所述的方法,其特征在于,所述新结果包括所选择的建议话题对其具有附连的一个或多个信息项。
46.如权利要求1所述的方法,其特征在于,所述话题集合包括由一个或多个用户定义的话题,用户是已提供了注册信息的搜索者。
47.如权利要求6所述的方法,其特征在于,一话题与一信息项之间的每一附连具有从由用户提供的分级确定的附连质量度量,每一附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量,所述细化话题评级方法考虑到任何潜在细化话题与所标识的信息项之间的附连的附连质量度量,并且其中,所述细化话题评级方法确定一细化度量,所述细化度量对每一潜在细化话题取决于从任一标识的信息项到所述潜在细化话题的附连的质量度量之和与来自任一标识的信息项的附连的质量度量之和之比。
48.如权利要求47所述的方法,其特征在于,所述细化评级方法包括对每一潜在细化话题,确定作为所述潜在话题与所标识的信息项中的任一个的所有附连的总体质量之和与所标识的信息项的所有附连的总质量度量之比的细化度量,使得评级最高的潜在细化话题是其细化度量最接近表达为百分比的50%的细化话题,且下一评级最高的潜在细化话题是其细化度量为下一最接近表达为百分比的50%的细化话题。
49.如权利要求3所述的方法,其特征在于,所述相似度选择方法考虑到任一潜在相似话题与所标识的信息项之间的附连的附连质量度量。
50.如权利要求1至10中任一项或权利要求49所述的方法,其特征在于,所述相似话题是根据依照一相似度话题评级方法确定的相似度评级来排序的。
51.如权利要求49所述的方法,其特征在于,所述相似度话题选择准则包括如果一特定话题与所述搜索结果中所标识的信息项的附连占所述搜索结果中的附连总数的百分比至少是预定义的百分比,且如果具有与所述特定话题的肯定分级的附连的信息项的个数至少是所述特定话题与所述搜索结果中的信息项的附连个数的预定义的不必为整数的倍数,则所述特定话题是相似话题。
52.如权利要求49所述的方法,其特征在于,所述相似度话题选择准则包括如果满足以下各条件则一特定话题是第一话题的相似话题(i)在所述话题集合中有第一话题,使得具有与所述第一话题的肯定分级的附连的信息项包括所述搜索结果,且使得具有与所述第一话题的肯定分级的附连的信息项的个数不会太大,
(ii)具有与所述特定话题的肯定分级的附连的信息项包括具有与所述第一话题的肯定分级的附连的信息项,以及(iii)具有与所述特定话题的肯定分级的附连的信息项的个数至少是所述搜索结果中的信息项的个数的预定义百分比。
53.如前述权利要求中任一项所述的方法,其特征在于,还包括向用户显示所述信息项中选择的一个,作为所述用户选择所述选择的一个信息项的结果,用户是已提供了注册信息的搜索者;从所述用户接受新话题,以作为所选择的一个信息项的话题而添加到所述话题集合;以及创建所述多个信息项中选择的一个与所述新话题之间的新附连。
54.如权利要求13或53所述的方法,其特征在于,还包括从所述用户接受对所述新话题的一个或多个子话题以对所述用户形成所述新话题和所述一个或多个子话题的分层结构;以及形成所述子话题中的每一个与所述多个信息项之一之间的附连。
55.如权利要求54所述的方法,其特征在于,所述细化话题选择方法包括对潜在细化话题评级以为所述细化话题确定排序的细化话题评级方法;所述细化话题评级方法使用子话题分层结构。
56.如权利要求55所述的方法,其特征在于,所述细化话题评级方法被设置成使得在一个或多个用户创建了包括第一话题和作为所述第一话题的子话题的第二话题的第一子话题分层结构之后,选择所述第一话题的、不必是用户且不必是所述第一子话题分层结构的创建者之一的搜索者可能被呈现所述第二话题作为所述细化话题之一。
57.如权利要求55所述的方法,其特征在于,所述细化话题评级方法被设置成使得对第一话题之后的第一潜在细化话题以及所述第一话题之后的第二潜在细化话题,如果使含有所述第一潜在细化话题的子话题分层结构作为所述第一话题的子话题的用户比使含有所述第二潜在细化话题的子话题分层结构作为所述第一话题的子话题的用户多,则所述细化话题评级方法将所述第一细化话题评级为比所述第二细化话题高。
58.如权利要求15所述的方法,其特征在于,还包括形成向所述搜索者显示的网页,所述网页包括所标识的信息项中的至少某一些以及所述建议话题中的至少某一些。
59.一种承载指示处理系统的处理器执行如前述权利要求中任一项所述的方法的一个或多个计算机可读代码段的承载介质。
60.一种承载数据结构的计算机可读承载介质,所述数据结构包括被配置成储存一话题集合的话题数据结构,所述话题数据结构具有用于每一话题的元素,所述话题数据结构还被配置成使得对所述话题集合无需存在话题分层结构;被配置成储存一用户集合的用户数据结构,用户是已提供了注册信息的搜索者,所述用户数据结构具有用于每一话题的元素,每一用户数据结构元素包括所述用户的注册信息;被配置成储存一附连集合的附连数据结构,每一附连是所述话题集合中的话题之一与一信息项集合中的一个信息项之间的附连,所述附连数据结构具有用于每一附连的元素;以及被配置成供指导由所述话题集合辅助的搜索的计算机实现的方法使用的数据结构,所述计算机实现的方法如权利要求1至59中任一项所述。
61.如权利要求60所述的承载介质,其特征在于,所述数据结构采用关系型数据库的表集合的形式,并且其中,所述话题数据结构、所述用户数据结构和所述附连数据结构中的每一个都采用了关系型数据库的表的形式。
62.如权利要求60至61中任一项所述的承载介质,其特征在于,所述新搜索结果包括所选择的建议话题对其具有附连的一个或多个信息项。
权利要求
1.一种指导由话题集合辅助的搜索的计算机实现的方法,所述话题不必具有分层结构,每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括根据由第一搜索者提供的搜索请求信息为所述第一搜索者标识所述多个信息项中的一个或多个信息项,所述搜索请求信息包括由搜索短语和所述话题集合中的一个或多个搜索话题的子集构成的组中的至少一个;从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及向所述第一搜索者提供搜索结果,所述搜索结果包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,其中,所述建议话题包括使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题,使得所述第一搜索者选择所述建议话题之一将生成一新的建议话题集合,并使得为所述第一搜索者的特定搜索在进行中形成一话题分层结构。
2.如权利要求1所述的方法,其特征在于,所述话题和所述信息项之间的附连的至少某一些是由用户定义的,用户是已提供了注册信息的搜索者。
3.如权利要求2所述的方法,其特征在于,所述附连中的至少一个具有附连质量度量,所述话题和信息项之间的附连的附连质量度量是从由用户提供的分级中确定的,一特定附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量。
4.如权利要求3所述的方法,其特征在于,所述细化选择方法考虑任何潜在细化话题和所标识的信息项之间的附连的附连质量度量。
5.如权利要求1所述的方法,其特征在于,根据所述细化话题选择方法,潜在细化话题是具有与所标识的项的至少一个的附连的话题,且所述细化话题是从所述潜在细化话题中选择的。
6.如权利要求5所述的方法,其特征在于,所述细化话题选择方法包括对潜在细化话题评级以为所述细化话题确定排序的细化话题评级方法。
7.如权利要求6所述的方法,其特征在于,所述细化话题评级方法确定一细化度量,它对每一潜在细化话题确定细化度量,所述细化度量取决于所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比。
8.如权利要求7所述的方法,其特征在于,所述细化评级方法包括对每一潜在细化话题,确定作为所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比的细化度量,使得评级最高的潜在细化话题是其细化度量最接近表达为百分比的50%的细化话题,且下一评级最高的潜在细化话题是其细化度量是下一最接近于被表达为百分比的50%的细化话题,由此其细化度量是被表达为百分比的50%的细化话题将所标识的信息项分为两个相等大小的信息项集合。
9.如权利要求7所述的方法,其特征在于,所述细化评级方法包括对每一潜在细化话题,根据以下两项的平方和确定细化度量所标识的信息项中与所述潜在细化话题附连的个数与所标识的信息项的个数之比,以及所标识的信息项中不与所述潜在细化话题附连的个数与所标识的信息项的个数之比,使得评级最高的潜在细化话题是其细化度量最小的细化话题,且下一评级最高的潜在细化话题是其细化度量为下一最小的细化话题。
10.如权利要求7所述的方法,其特征在于,所述附连中的至少一个具有附连质量度量,所述话题和信息项之间的附连的附连质量度量是从由用户提供的分级中确定的,一特定附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量,以及所述细化评级方法包括对每一潜在细化话题,根据以下两项的平方和确定细化度量所述潜在细化话题与所标识的信息项中的任一个的所有附连的总体质量之和与所标识的信息项的所有附连的总质量度量之比,以及所标识的信息项中的任一个与除所述潜在细化话题之外的任何话题之间的所有附连的总体质量之和与任何所标识的信息项的所有附连的总质量度量之比,使得评级最高的潜在细化话题是其细化度量最小的细化话题,且下一评级最高的潜在细化话题是其细化度量为下一最小的细化话题。
11.如权利要求1所述的方法,其特征在于,每一信息项是网页。
12.如权利要求1所述的方法,其特征在于,还包括从用户接受所述多个信息项之一与所述话题集合之一之间的新附连,用户是已提供了注册信息的搜索者。
13.如权利要求1所述的方法,其特征在于,还包括从用户接受要添加到所述话题集合的新话题以及所述多个信息项之一与所述新话题之间的新附连,用户是已提供了注册信息的搜索者。
14.如权利要求1所述的方法,其特征在于,所述标识一个或多个信息项包括从所述第一搜索者接受所述搜索请求信息;以及根据所接受的搜索请求信息以及一个或多个搜索准则搜索所述多个信息项以标识所述一个或多个信息项,所述搜索准则包括各自具有与所接受的搜索请求信息中的每一话题的附连的所标识的信息项。
15.如权利要求14所述的方法,其特征在于,还包括向所述第一搜索者显示所述搜索的结果。
16.一种指导由话题集合辅助的搜索的计算机实现的方法,所述话题不必具有分层结构,所述话题集合中的每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括定义所述附连,所述对每一附连的定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义附连包括从至少一个用户接受至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连,使得所述话题集合中的每一话题具有与所述多个信息项中的至少一个信息项的至少一个附连;根据由第一搜索者提供的搜索请求信息为所述第一搜索者标识所述多个信息项中的一个或多个信息项,所述搜索请求信息包括由搜索短语和来自所述话题集合的搜索话题构成的组中的至少一个;从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及向所述第一搜索者提供搜索结果,所述搜索结果包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,其中所述建议话题包括使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题,使得选择所述建议话题之一将生成一新的建议话题集合,使得为特定搜索在进行中形成一话题分层结构。
17.如权利要求16所述的方法,其特征在于,不同用户定义同一话题和同一信息项之间的不同附连,使得由不同用户定义的多个附连可存在于一特定话题和一特定信息项之间。
18.如权利要求17所述的方法,其特征在于,一特定话题和一特定URL之间的每一附连具有从由不同用户提供的所述特定话题和所述特定URL之间的不同附连个数确定的附连质量度量。
19.如权利要求17所述的方法,其特征在于,一特定话题与一特定URL之间的每一附连具有从由不同用户提供的分级中确定的附连质量度量,每一附连最初被分配当更多用户对所述附连分级时可改变的初始质量度量。
20.如权利要求19所述的方法,其特征在于,对一特定附连分级的特定用户根据二元值分级来对所述附连分级,所述二元值分级具有第一分级(“肯定”)和不如所述第一分级令人满意的第二分级(“否定”)。
21.一种方法,包括定义话题集合中的每一话题与信息项集合中的相应信息项之间的一个或多个附连,所述话题不必具有分层结构,所述对每一附连的定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义附连包括从至少一个用户接受至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连,使得所述话题集合中的每一话题具有与所述多个信息项中的至少一个信息项的至少一个附连,其中所述话题用于由特定搜索者根据由所述特定搜索者提供的搜索请求信息在所述多个信息项中搜索一个或多个信息项,所述搜索请求信息包括所述话题集合中的至少一个话题,所述搜索包括标识具有与所述搜索请求信息中的至少一个话题的附连的至少一个或多个信息项。
22.如权利要求21所述的方法,其特征在于,还包括从用户接受要添加到所述话题集合的新话题;以及将所接受的新话题添加到所述话题集合。
23.如权利要求21所述的方法,其特征在于,预定义初始的多个话题。
24.如权利要求21所述的方法,其特征在于,第一用户定义第一话题与第一信息项之间的第一附连以及第二用户定义所述第一话题与所述第一信息项之间的附连的结果是在所述第一话题与所述第一信息项之间存在至少两个附连。
25.如权利要求24所述的方法,其特征在于,还包括从用户接受对所述话题集合中的一特定话题与一特定信息项之间的特定附连的分级,使得所述特定话题与所述特定信息项之间的多个附连可具有不同的分级。
26.如权利要求25所述的方法,其特征在于,所述分级具有两个值,即第一值(“肯定”)和不如第一值令人满意的第二值(“否定”)。
27.如权利要求25所述的方法,其特征在于,所述分级具有两个以上值。
28.如权利要求25所述的方法,其特征在于,还包括基于用户对所述特定话题与所述特定信息项之间的附连的分级,为所述特定话题和所述特定信息项之间的一个或多个附连确定一总体附连质量。
29.一种提供用于一搜索方法的用户界面的计算机实现的方法,所述搜索方法由一话题集合来辅助,所述话题不必具有分层结构,每一话题具有与多个信息项中的至少一个信息项的至少一个附连,所述方法包括引起向第一搜索者显示第一用户界面,所述用户界面允许所述搜索者输入包括由搜索短语和所述话题集合中的一个或多个搜索话题的子集构成的组中的至少一个的搜索请求信息;执行所述搜索方法,所述搜索方法包括接受所述第一搜索者输入的所述搜索请求信息;根据所接受的搜索请求信息标识所述多个信息项中的一个或多个信息项;以及从所述话题集合中确定一个或多个建议话题,所述建议话题是根据所述建议话题与一个或多个所标识的信息项的附连来确定的;以及作为执行所述搜索方法的结果,引起向所述第一搜索者显示第二用户界面,所述第二用户界面包括所标识的信息项中的至少某一些和所述建议话题中的至少一个,所述第二用户界面为所述第一搜索者提供了选择所述建议话题之一的能力,其中所述建议话题包括使用一细化选择方法根据一细化话题准则从所述话题集合中确定的一个或多个细化话题,使得所述第一搜索者使用所显示的第二用户界面选择所述建议话题之一生成一新的建议话题集合,并引起向所述第一搜索者显示所述新建议话题集合中的至少某些话题,使得对所述第一搜索者的特定搜索在进行中形成一话题分层结构。
30.如权利要求29所述的方法,其特征在于,向查看者最多显示预定个数的细化话题。
31.如权利要求29所述的方法,其特征在于,所述第一用户界面和所述第二用户界面分别是第一网页和第二网页。
32.如权利要求29所述的方法,其特征在于,还包括从所述搜索者接受新的搜索请求信息;确定包括所标识的信息项集合和一个或多个建议话题的新集合的新搜索结果,所述新搜索结果是通过向所接受的新搜索请求信息应用所述一个或多个搜索准则来确定的;以及向所述搜索者呈现所述新搜索结果。
33.如权利要求32所述的方法,其特征在于,所接受的新搜索请求信息包括从先前的建议话题中选择的话题;所述新搜索结果中的信息项具有与所述从先前的建议话题中选择的话题的附连。
34.如权利要求29所述的方法,其特征在于,呈现给所述第一搜索者的建议话题包括根据与所标识的信息项有关的话题相似度准则从所述话题集合中确定的一个或多个相似话题。
35.如权利要求34所述的方法,其特征在于,所述相似话题是根据依照一相似度话题评级方法来确定的相似度评级来排序的。
36.如权利要求35所述的方法,其特征在于,最多向查看者显示预定个数的相似话题。
37.一种方法,包括定义一话题集合用于附连到多个信息项中的一个或多个信息项,所述定义是由至少一个用户进行的,用户是已提供了注册信息的搜索者,所述定义话题包括从至少一个用户接受至少一个话题;以及将所述话题添加到所述话题集合,其中所述话题不必具有分层结构;其中每一话题用于附连到所述多个信息项中的一个或多个信息项,以及其中附连到至少一个信息项的所述话题用于由特定搜索者根据由所述特定搜索者提供的搜索请求信息来搜索所述多个信息项中的一个或多个信息项,所述搜索请求信息包括所述话题集合中的至少一个话题,所述搜索包括标识具有与所述搜索请求信息中的至少一个话题的附连的至少一个信息项。
38.如权利要求37所述的方法,其特征在于,还包括从至少一个用户接受所述话题集合中的至少一个话题与所述多个信息项中的至少一个信息项之间的至少一个附连;以及对先前没有与一信息项的附连的任何话题,将所述话题添加到一个或多个话题的组,所述一个或多个话题中的每一个具有与所述多个信息项中的至少一个信息项的至少一个附连。
39.如权利要求37所述的方法,其特征在于,预定义一初始话题集合。
40.如权利要求38所述的方法,其特征在于,第一用户定义第一话题与第一信息项之间的第一附连以及第二用户定义所述第一话题与所述第一信息项之间的附连的结果是在所述第一话题与所述第一信息项之间存在至少两个附连。
41.如权利要求39所述的方法,其特征在于,还包括从用户接受对所述话题集合中一特定话题与一特定信息项之间的特定附连的分级,使得所述特定话题与所述特定信息项之间的多个附连可具有不同的分级。
42.如权利要求41所述的方法,其特征在于,所述分级具有两个值,即第一值(“肯定”)和不如所述第一值令人满意的第二值(“否定”)。
43.如权利要求41所述的方法,其特征在于,所述分级具有两个以上值。
44.如权利要求41所述的方法,其特征在于,还包括基于用户对所述特定话题与所述特定信息项之间的附连的分级对所述特定话题与所述特定信息项之间的一个或多个附连确定总体附连质量。
45.一种承载指示处理系统的处理器执行如前述权利要求中任一项所述的方法的一个或多个计算机可读代码段的承载介质。
全文摘要
指导由不必具有分层结构的话题集合辅助的搜索的计算机实现的方法和软件产品。每一话题附连到多个信息项中的至少一个信息项,诸如由URL标识的网页。该方法包括标识多个信息项中的一个或多个信息项,根据建议话题与所标识的信息项的附连从话题集合中确定一个或多个建议话题,并向用户提供包括所标识的信息项中的至少某一些以及建议话题中的至少一个的搜索结果。选择建议话题之一生成一新的建议话题集合,使得对特定搜索在进行中形成话题分层结构。
文档编号G06F17/30GK101073077SQ200580035172
公开日2007年11月14日 申请日期2005年9月9日 优先权日2004年9月10日
发明者E·派拉蒙, F·萨曼加, O·本-沙查, I·丹, G·泰弗 申请人:色杰斯提卡股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1