概念上组织和表述信息的方法和系统的制作方法

文档序号:6433727阅读:118来源:国知局
专利名称:概念上组织和表述信息的方法和系统的制作方法
技术领域
本发明的实施例一般的涉及概念上的组织信息的领域,并且尤其涉及概念相关信息的使用分析以有效组织信息。
背景技术
随着信息的迅速增长,组织信息的能力也在增长。在互联网相关的网络(例如万维网)或者其他互联网源上可以找到大量信息源。互联网是计算机网络的扩展网络,信息通过本领域技术人员公知的方法(例如TCP和IP协议的使用等等)而在互联网上交换。互联网允许用户在连接到该网络的计算机之间发送和接收数据。这些数据可以包括网站、主页、数据库、文本集合、音频、视频或者通过连接到互联网的计算机服务器在互联网上可用的任何其他类型的信息。这些信息可以被称为文件或者文档,并且可以包括网页、网页上的数据、网页附件或者存储设备(例如数据库)中包含的其他数据。理解如此大量文档集合的意义并且在这种环境中搜索信息,在没有专门的辅助手段时是很困难的。一种辅助定位信息的方法是使用关键词。也就是说,文档可以包括表示包含在文档中的信息的选定部分的关键词。这些关键词在互联网上对其他计算机是可用的并且允许其他计算机定位该文档。为了定位互联网上的文档,远程计算机的用户使用被称为搜索引擎的搜索程序而搜索关键词。搜索引擎是允许远程用户键入一个或多个搜索词的程序。然后搜索引擎将搜索查询与文档中的关键词相比较并且至少检索文档中具有与搜索查询匹配的关键词的部分。然后搜索引擎对用户显示部分文档,例如标题。用户可以在检索到的局部文档中滚动浏览并且选择所需文档。早期的关键词搜索引擎显示出严重缺陷。例如,为了增加特定文档的出现率,文档提供者可以使用与文档相关的尽可能多的搜索词。实际上,某些文档或者搜索引擎使用文档中的每个词作为关键词。因此,搜索引擎会检索到大量与用户需要通过搜索词组合寻找的主题无关或者仅边缘相关的文档。并且,这些搜索引擎的很多用户并不熟悉形成关键词搜索查询的技巧并且产生过于宽泛的搜索从而经常检索到数千个文档。那么用户必须检查关于各个文档的摘要信息以定位所需信息。这种缺陷通过搜索引擎的演变得以解决,即包括基于一个或多个用户的搜索活动的信息组织。这些方法基于用户偏好度多数意见而不是面向文档的参数(例如文本)而对结果排序。其中一种这样的方法根据基于所使用的关键词的演化得分而对文档排序。也就是说,文档接收与搜索查询的关键词相关的相关度分数。随着用户输入搜索查询并且在查询产生的文档列表中选择文档时,文档的相关度分数被调整。这些分数被用于组织文档的结果列表以进行后续搜索。这些方法典型的(至少在部分上)基于文档接收到的“点击”次数(即文档被选择的次数)而确定相关度。这些方法通常称为“人气排序方法”或者“点击人气方法”,提供了将最吸引并且满足最大多数先前用户的文档排列在最前面的搜索结果列表。而且,点击人气方法产生反映搜索上下文的结果。例如,先前的搜索方法会返回包含所有查询词的文档,但是不会自动排除不是查询部分的词。因此,对于“Mexico”的文本匹配搜索最有可能返回关于“New Mexico”的结果。点击人气方法可以减少这种错误结果,因为搜索“Mexico”的用户通常不会点击关于“New Mexico"的页面并且会倾向于点击他们认为与“Mexico”最相关的页面,从而增加了所需文档的相关度。由于与查询词相关的信息随着时间可能改变,基于点击次数确定相关度可能导致错误结果。例如,对于“民主先驱”的特定查询,涉及早期先驱Howard Dean的文档可能在 2003年12月被选择了很多次,但是2004年3月输入该查询的用户可能期望在此时作为领袖的John Kerry的结果。并且,排在最前面的结果通常会受到不成比例的更多的使用,这样导致了越来越歪曲的搜索结果,其中排在最前面的结果永远不会被替代。通过使用包括基于时间和基于使用的因素在内的大量因素对响应于查询提供的信息进行组织的搜索引擎已经解决了这些缺陷中的一部分。例如,这种方法可能使用先前用户响应于特定查询的活动而调整查询响应文档的相关度。这样的用户活动可以包括点击次数以及先前用户对特定信息的选择或者使用的时间。这些方法还可以将特定文档在先前用户对其选择时排列在先前结果列表中何处、文档的实际和期望使用频率的对比以及选定的文档如何被使用等考虑在内。然而,在当前方法中仍然存在大量缺陷。例如,当前方法并没有解决非常稀少的查询的问题,其中并没有汇集足够的用户活动数据。在此情况下,结果可能很少或者不存在。 并且,点击结果依赖于数据源的质量和完整性。当前方法不能解决数据源质量的巨大差异。 而且,当前方法受到欺骗影响,可能影响搜索结果的完整性。根据现有技术的一种示例方法试图通过在用户活动的基础上更新搜索引擎结果而解决某些问题。这种方法在名称为 "Search Engine”的美国专利No. 6,421,675中进行了描述,其内容作为引用而结合于此,从而提供了对现有技术的全面描述并且明确区分本发明各个实施例的特征。

发明内容
本发明提供了一种方法,该方法包括接收并记录查询,所述查询接收自多个用户;确定对应于所述查询的搜索结果;接收并记录所述多个用户的一个或多个搜索结果选择;将所述选择与所记录的查询相关联;从用户处接收包含所述查询的信号;以及响应于所述查询而将包含与所述查询关联的选择的一个或多个搜索结果提供给所述用户。本发明还提供了一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS能够从多个用户接收查询、响应于所述查询而将一个或多个搜索结果提供给所述用户,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够接收并记录包含所述用户的一个或多个搜索结果选择的信号、将所记录的搜索结果选择与所记录的查询相关联、接收所述查询、以及响应于所述查询而提供一个或多个包含与所述查询关联的搜索结果的搜索结果;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。本发明还提供了一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS 能够从多个用户接收第一查询、确定对应于所述第一查询的多个搜索结果,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够将所述多个搜索结果提供给所述用户、将所记录的搜索结果选择与所记录的特定选择相关联、接收查询、以及响应于所述查询而提供多个搜索结果,其中所述多个搜索结果包含了所述特定选择和关联的搜索结果选择;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及特定选择和搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。


通过参考下面的描述可以更好的理解本发明,并且利用附图表示本发明的实施例。在附图中图1为显示根据本发明一个实施例的基于来自多个用户的响应的关联而修改概念相关信息集合的组织和表述的程序的流程图;图2为显示根据本发明一个实施例的通过基于在其他用户的类似信息搜索会话期间获取的用户活动和/或用户信息的关联而影响用户查询与存储内容的联系的程序的流程图;图3为显示根据本发明一个实施例的用于组织并且表述概念相关信息以及用于联系特定存储内容和各个用户查询的系统的结构图;图4显示了根据本发明一个实施例的三个独立用户的搜索日志;图5为显示根据本发明一个实施例的提供更多相关搜索结果的程序的流程图;图6为显示根据本发明一个实施例的提供相关查询建议的程序的流程图;图6A为显示根据本发明一个实施例的提供查询拼写校正建议的程序的流程图;图7为显示根据本发明一个实施例的提供建议查询的程序的流程图;图8为显示根据本发明一个实施例的提供类似结果的程序的流程图;图9为显示根据本发明一个实施例的对信息进行相关以提供更相关的搜索结果的程序的流程图;图10为显示根据本发明一个实施例的根据与选择相关联的位置而基于用户位置提供更相关的搜索结果的程序的流程图;图11为显示根据本发明一个实施例的基于用户位置对用户提供更相关的搜索结果的程序的流程图;以及图12为显示根据本发明一个实施例的数字处理系统的结构图。
具体实施例方式鍵本发明的实施例提供了用于概念上组织和表述信息的方法和系统,其中使用用户对信息组织和表述的响应的关联以确定信息的最优组织和表述。在本发明一个实施例中, 在搜索引擎结果优化的上下文中,搜索会话期间多个用户的用户活动和/或用户信息与查询进行关联,以影响查询与文档的组织和表述之间的演化联系。根据这些实施例的系统存储整个搜索会话过程中的用户活动,从而可以使大量不同类型的用户活动和用户信息可以关联。使用关联的用户输入允许这些系统提供相关的搜索结果而不会产生现有技术中基于关键词的系统带来的限制。在下面的描述中将给出大量特定细节。然而,应当理解,本发明的实施例可以实施为不具有这些特定细节。在其他实施例中,公知的电路、结构和技术不再详细描述以避免模糊对本说明书的理解。整个说明书中提到的“一个实施例”或“实施例”表示结合该实施例描述的特定特征、结构或者特点包含在本发明的至少一个实施例中。因此,在整个说明书中多处出现的短语“在一个实施例中”或“在实施例中”并不一定全部是指同一实施例。而且,可以在一个或多个实施例中以任何适当方式将特定特征、结构或者特点结合在一起。而且,所发明的方面包含在少于单个公开的实施例的所有特征中。因此,说明书后附的权利要求书被明确包含在本具体实施方式
中,每项权利要求书自身作为本发明的一个单独实施例。图1显示了根据本发明一个实施例的基于来自多个用户的响应的关联而修改概念相关信息集合的组织和表述的程序。图1中所示的程序100开始于操作105,其中概念相关信息集合通过信息提供者被组织并且被表述给多个用户。在一个实施例中,概念相关信息集合是包含有关于特定用户组感兴趣的一般概念的信息的集合页面。这种集合页面可以包括大量任何种类的相关子概念,包括与文件、目录、数据库、电子数据表、新闻条目、音频、视频、图像、应用程序、广告、产品描述以及参考信息的链接,与列表、表格、树、或者上述项目的任何目录的链接,以及与其他集合页面的链接,所有这些内容可以从任意数量的来源收集。在一个实施例中,单独形成的多个集合页面创建为改变信息集合的组织和表述,包括相关子概念的数量、类型、安排和显著度。这样,信息提供者尝试预期组织和表述信息的最优方式。在操作110,信息提供者从用户接收关于信息组织和表述的响应。用户响应可以为选择(或者不选择)某部分信息的形式。例如,某些用户可以选择给定集合页面的特定子概念的信息,而不选择其他的。在操作115,从多个用户接收到的响应被关联。也就是说,确定单独用户进行的相同统计上有效的联系的程度。在本发明的可替换实施例中,响应的关联可以采取任何形式。 各种用户响应的示例关联在下文中将更加详细的描述。在操作120,基于关联后的响应而修改概念相关信息集合的组织和表述。例如,可以重新形成集合页面以更加充分地满足单独用户、用户组或某类用户、或者所有用户的需要。除了修改原始表述的信息的表述,所述重新形成可以包括添加或者删除信息。例如,可以添加一个或多个子概念到集合页面或者从其中删除。尽管上面一般性的描述了使用用户响应以优化信息集合(例如集合页面)的组织和表述,本发明的实施例可以用于影响用户搜索引擎查询和存储内容(例如一个或多个文档)的联系。也就是说,本发明的实施例可以用于响应于特定查询确定更加相关的搜索结果(即一般性的更加相关或者对特定用户更加相关)。图2显示了根据本发明一个实施例的通过基于在其他用户的类似信息搜索会话期间获取的用户搜索引擎(USE)活动和/或用户信息的关联而影响用户查询与存储内容的联系的程序。图2所示的程序200开始于操作205,其中对若干独立用户记录搜索会话期间的 USE活动信息和/或用户信息。搜索会话包括给定用户的任何搜索引擎动作(可通过搜索引擎记录的活动)的序列。USE活动可以包括发出查询、点击搜索页面上的导向内部或者外部数据的链接、点击后续内部页面上的导向内部或者外部数据的链接以及在点击内部或者外部链接之后返回搜索页面或者任何内部页面。USE活动可以为连续的或者在实际持续周期中发生。也就是说,可以指定表示搜索会话终止的时间周期。例如,如果所记录的用户活动中的中断超过了指定时间,在实际中可以假定搜索会话已经结束。后续用户活动可以认为是新的搜索会话。在操作210,所记录的若干独立用户的USE活动信息和/或用户信息被关联。所述信息反映了各个用户的整个搜索会话,可以根据本发明的可替换实施例以各种方式进行关联。各种USE活动和/或用户信息的示例关联在下文中将更加详细描述。在操作215,通过操作210获得的所记录的若干独立用户的USE活动信息和/或用户信息的关联结果被用于影响特定存储内容和对应用户查询之间的联系。这种联系可以提供一般性的或者对于一个或多个特定用户更加相关的给定查询的搜索结果。本发明的实施例可以在网络环境中实施。图3显示了根据本发明一个实施例的用于组织并且表述概念相关信息以及用于联系特定存储内容和各个用户查询的系统。如图3 所示的系统300显示了数字处理系统(DPS)300的网络,包括显示为服务器DPS 320的一个或多个服务器DPS,以及显示为客户端DPS 305-308的多个客户端DPS。系统300的DPS互相连接并且配置为交换多个各种类型的包含文档的存储内容,例如网络页面、网络页面上存储的内容,包括文本、图片以及音频和视频内容。例如,所存储的内容可以为音频/视频文件,例如具有移动图像和音频的程序。信息可以通过任何类型的通信网络在DPS之间进行通信,多个不同设备可以通过所述通信网络进行通信,例如(但不限于)互联网、未显示的广域网(WAN)、局域网(LAN)、内联网等等。例如,如图3所示,DPS通过互联网310而互相连接,互联网310是包含具有如上所述的数据通信方法的多个网络的其中一种,并且对于本领域技术人员是公知的。连接服务器DPS和客户端DPS的通信链接并不一定为直接链接,而是可以为间接链接,包括但不限于广播无线信号、网络通信等等。尽管图3中显示了示例的DPS,可以理解,可以互相连接大量这样的DPS。根据本发明一个实施例的可以用于服务器DPS 320或者客户端DPS 305-308的数字处理系统的实施例将在下文中参考图12进行描述。
根据本发明一个实施例,概念相关信息的集合,例如集合页面,通过客户端DPS 305-308表述给若干用户。所述概念相关信息还可以为响应于从一个或多个客户端DPS 305-308发送的用户查询的搜索结果。所述信息可以采用多种形式,例如可以为通过网络页面开发者提供的网页URL地址列表。一旦表述在客户端DPS上,用户对所述表述做出一定响应。例如,用户可以执行如上所述的USE活动。与对用户的信息表述相关的用户响应和其他用户信息被记录并且被发送到用户响应/信息关联应用程序321。该应用程序321对若干用户的用户响应和信息进行关联,并且基于关联的结果修改概念相关信息的组织和表述。数据分析本发明的实施例获取USE活动信息和/或用户信息并且对这些信息进行关联, 以通过使用多个用户的多数选择而辅助定义相关度。所述关联分析包括评价共同动作或者多个用户信息的程序,以识别统计上有效的联系。对这些实施例使用的术语“联系 (association),,禾口 “统计上有效的联系(statistically significant association),,定义如下。“联系”为搜索会话期间用户明确或者间接、有意识或者无意识确定的查询、术语、 概念、文档或者其他网络数据及其组合的任何配对。联系可以通过发出查询和/或选择导向查询、术语、概念、文档或者其他网络数据的链接(例如超链接)而表示。统计上有效的联系为概率上不能归属于随机事件的联系。当通过两个或者更多表面上独立的用户进行统计上有效的联系时记录所述关联。本发明的实施例通过记录更加大量的信息和更加特定的信息(包括USE活动信息和/或用户信息)而提供了比现有技术方法远远更加相关的搜索引擎结果,并且实现了信息的更加深入的分析。本发明的一个实施例提供了一种创建并且操作如表1所示维护所有USE活动信息和用户信息的数据文件的系统。(用于描述本发明各个实施例的表格仅是示例性的并且不一定表示本发明实施例的实际数据结构。)
权利要求
1.一种方法,该方法包括接收并记录查询,所述查询接收自多个用户;确定对应于所述查询的搜索结果;接收并记录所述多个用户的一个或多个搜索结果选择;将所述选择与所记录的查询相关联;从用户处接收包含所述查询的信号;以及响应于所述查询而将包含与所述查询关联的选择的一个或多个搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其中由所述用户选择多个搜索结果,该方法还包括 确定所选择的搜索结果与所述查询的相关度;以及基于所选择的搜索结果与所述查询的相关度而确定提供哪个所选择的搜索结果给所述用户。
3.根据权利要求2所述的方法,其中确定所选择的搜索结果的相关度包括 确定选择所述搜索结果的用户数量以及所述用户查看所选择的搜索结果的持续时间中的至少一者;以及将用户选择数量以及用于所述搜索结果的持续时间中的至少一者与由所述用户选择的多个搜索结果中的剩余搜索结果的相关度进行比较。
4.根据权利要求1所述的方法,该方法还包括 确定所述查询的特性;以及将所记录的搜索结果选择与所确定的所述查询的特性相关联。
5.根据权利要求4所述的方法,该方法还包括将与所确定的所述查询的特性关联的一个或多个搜索结果提供给所述用户。
6.根据权利要求4所述的方法,其中所述查询包括一个或多个词并且所述查询的特性包括查询中的词的拼写或常见误拼写、查询中的词的同义以及查询的词的等价措辞中的至少一者。
7.根据权利要求4所述的方法,其中所述查询中的词具有不同的意义,该方法还包括 将基于所述词的更加流行的意义的搜索结果提供给所述用户。
8.根据权利要求1所述的方法,其中所述搜索结果是URL。
9.一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS能够从多个用户接收查询、响应于所述查询而将一个或多个搜索结果提供给所述用户,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够接收并记录包含所述用户的一个或多个搜索结果选择的信号、将所记录的搜索结果选择与所记录的查询相关联、接收所述查询、以及响应于所述查询而提供一个或多个包含与所述查询关联的搜索结果的搜索结果;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。
10.一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS能够从多个用户接收第一查询、确定对应于所述第一查询的多个搜索结果,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够将所述多个搜索结果提供给所述用户、将所记录的搜索结果选择与所记录的特定选择相关联、接收查询、以及响应于所述查询而提供多个搜索结果,其中所述多个搜索结果包含了所述特定选择和关联的搜索结果选择;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及特定选择和搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。
全文摘要
提供了一种对查询提供响应的方法和系统。相同搜索会话期间发出的多个选择被联系。从用户接收查询并且对应于所述查询提供搜索结果。响应于用户发出的选择,提供一个或者多个联系的选择。在本发明一个实施例中,搜索结果URL与一个或者多个查询相联系,其中所述URL的选择和所述查询包含在搜索会话中。响应于查询,提供包含一个或者多个URL和与各个URL联系的任何查询的搜索结果。
文档编号G06F17/30GK102354313SQ20111028283
公开日2012年2月15日 申请日期2004年12月7日 优先权日2003年12月8日
发明者A·杰拉索利斯, A·柯蒂斯, A·莱文 申请人:Iac搜索和媒体公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1