使用与信息关联的语义语境便于协作搜索的制作方法

文档序号:7736203阅读:184来源:国知局
专利名称:使用与信息关联的语义语境便于协作搜索的制作方法
技术领域
本发明涉及通过通信网络来有效访问信息。
背景技术
由于通过诸如搜索引擎的各种搜索工具而可以在线获取的可用信息不断扩大可利用性,互联网的使用日益流行。遍及本地企业和远程互联网,计算机用户面临不得不把巨大数量的信息分类。互联网快速成为了用于获取有关产品、地点、人物等的信息的主要信息搜索工具。遗憾地,由于可用数据难于管理的数量以及用户不能接收对于用户高效使用是期望的搜索结果,互联网也迅速变成其自身成功的受害者。与互联网搜索方法学有关的一个问题是通过表面上直接搜索所获得的不期望数量的搜索结果。即使对于最有经验的互联网搜索者,关于任何特定论题的可用信息的数量也可能是巨大的。通常,搜索结果充满了可能不适用于搜索者所希望的搜索语境的大量信息。此外,搜索者可能希望多于其他类型的某种信息类型。当然,缺点是搜索者不得不筛选表面上不属于搜索者兴趣/希望的搜索结果容量。因此,诸如搜索引擎的工具和文档管理系统可能通过将越来越多数量的信息推向用户桌面,产生被数据淹没的感觉而加重了该问题。此外,认识到当前搜索技术是反应性的并且同样地,需要用户停止他们当前任务并且查询访问信息的数据源。此外,增加“信息混乱”是当今许多计算机用户从事多重、通常不同的项目的事实, 并且用户对于存储在其计算机中的相关信息(与他们当前项目有关)的有序且优化访问可能是难以解决的。这种组织能力的缺乏可能显著降低用户(例如,律师、会计、顾问、教育者、医生…)利用与其当前项目相关的信息经由计算机来高效工作的的能力。在用户计算机上与信息杂乱无章有关的普遍问题是“哪个相关文档在桌面上?,,;“哪个电子邮件线索是项目的一部分”;“什么网络搜索和结果在该项目内?”;“什么文档、报告、数据、电子邮件、 图片、视频为该项目的一部分”;以及“哪个文件在桌面系统、服务器上、或者在文档管理系统中? ”。这些组织问题的一种解决方案是用户手动创建并且管理用于相关信息的大量目录和文件夹。然而,这种组织类型的本质是任何希望的改变需要用户方的大量人力。当前搜索技术的另一缺点在于即使可能多个搜索者当前在线搜索类似的主题 (例如,佛罗里达的低价旅行),但是多个搜索者孤立地进行搜索。因此,多个搜索者不能平衡彼此花费在找到类似主题的任务上的时间。

发明内容
本发明的目的是提供信息处理环境以消除或者缓解至少一些以上所提出的缺点。诸如搜索引擎的工具和文档管理系统可能通过将越来越多数量的信息推向用户桌面,产生被数据淹没的感觉从而加重这种问题。此外,认识到,当前搜索技术是被动的并且同样需要用户停止其当前任务进而查询访问信息的数据源。当前搜索技术的另一缺点是即使可能存在着当前正在线搜索类似主题(例如,弗罗里达便宜旅行)的多个搜索者,但
5是多个搜索者隔离搜索。因此,多个搜索者不能平衡彼此花费在找到类似主题的任务上的时间。与当前系统和方法相反地,提供了用于便于在通信网络上属于共享主题的多个用户的社交网络的协作方法和系统。该方法和系统包括向协作服务器发送搜索语境以便在确定与类似主题关联的协作服务器的另一用户中使用,该搜索语境包括至少一个第一语境定义,以使第一语境定义具有从属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词。第一多个信息彼此相关并且通过搜索语境的第一语境定义来表示这种关系。系统和方法还包括接收与另一用户关联的匹配搜索语境的识别,以使匹配搜索语境含有认为与第一语境定义匹配的至少一个第二语境定义。匹配第二语境定义包括从属于与另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。所提供的第一方面为用于便于在通信网络上属于共享主题的多个用户的社交网络的协作方法,该方法包括向协作服务器发送搜索语境以便在确定与类似主题关联的协作服务器的另一用户中使用,该搜索语境包括至少一个第一语境定义,以使第一语境定义具有从属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词,该第一多个信息彼此相关并且通过搜索语境的第一语境定义来表示这种关系;以及接收与该另一用户关联的匹配搜索语境的识别,以使匹配搜索语境含有被认为与第一语境定义匹配的至少一个第二语境定义,匹配第二语境定义包括从属于与该另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。所提供的另一方面为用于便于在通信网络上属于共享主题的多个用户的社交网络的协作系统,该系统包括语境模块,适用于向协作服务器发送搜索语境以便在确定与类似主题关联的协作服务器的另一用户中使用,该搜索语境包括第一语境定义,以使第一语境定义具有从属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词, 该第一多个信息彼此相关并且通过搜索语境的第一语境定义来表示这种关系;以及该语境模块进一步适用于接收与该另一用户关联的匹配搜索语境的识别,以使匹配搜索语境含有被认为与第一语境定义匹配的第二语境定义,匹配第二语境定义包括从属于与该另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。所提供的另一方面为用于确定第一搜索语境和第二搜索语境之间匹配的协作系统,第一搜索语境包括第一语境定义以使第一语境定义具有从属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词,该第一多个信息彼此相关并且通过第一搜索语境的第一语境定义来表示这种关系,并且第二搜索语境包括第二语境定义以使第二语境定义具有从属于与该用户不同的另一用户的第二搜索信息集合的第二多个信息中选择的一个或者多个单词,该第二多个信息彼此相关并且通过第二搜索语境的第二语境定义来表示这种关系,该系统在通信网络上与该用户和该另一用户的装置通信,该系统包括通信模块,适用于接收与该用户关联的第一搜索语境和与该另一用户关联的第二语境;比较模块,适用于将第一语境定义与第二语境定义进行比较以确定该比较是否满足匹配阈值;以及通信模块,进一步适用于在满足该匹配阈值的情况下,为包括第二搜索语境的该用户的装置提供代表该比较的数据。所提供的另一方面为接收的搜索语境是基于用户请求或者与用户交互无关地、基于用户的协作引擎的请求,并且在确定比较的第二语境定义与至少一些第一语境定义匹配的情况下,则通过第一语境定义过滤第二语境定义。从数据库查询;文档的结构化查询;以及网页查询中选择请求。再者,协作引擎的请求是基于用户的活动由协作引擎所启动的预测性查询,其中,用户的活动选自除了在提交用户请求以前,当用户在参照系的搜索语境中时;除了在提交用户请求期间,当用户在参照系的搜索语境中时;以及除了在提交用户请求以后,用户在参照系的搜索语境中时。将来自搜索语境的语境定义提供给用户作为用于通过用户选择的查询建议。


现在仅以示例方式,结合附图描述本发明的典型实施方式,其中
图1是信息处理系统的部件的框图2示出了图1的系统的语境引擎的示例性配置;
图3示出了图2的语境引擎的示例性工作流程;
图4是用于实现图1和图10的系统部件的示例性计算装置的框图5是图3的语境引擎的操作流程图6示出了通过图3的语境引擎的信息14的示例性划分;
图7是图1的系统的语境引擎的示例性操作的流程图8是图1的系统的信息集合和语义语境15的组织的示例性实施方式
图9是图1的系统的语境引擎的示例性操作的流程图10是可以耦合至图1的系统的协作环境的部件的框图11示出了图10的环境的示例性搜寻信息集;
图12是图10的环境的选择性实施方式;
图13示出了图12环境的对应搜索语境和示例性搜索信息集;
图14是图10的环境的协作引擎的部件的框图15示出了图10的环境的协作服务器的比较处理的示例性结果;
图16示出了图10的环境的语境引擎的示例性配置;
图17是图10的环境的协作服务器的部件的框图18是图10的环境的操作流程图;以及
图19是经由图10的协作服务器所提供的示例性用户界面内容。
具体实施例方式信息处理系统10参照图1和图2,示出了用于创建和保持用于用户工作活动的定义的参照系 (FoR) 12的信息处理系统10,该信息处理系统包括通过通信网络11经由信息请求18和信息响应20从各种信息源16检索的信息14。信息源16可以被配置为直接与用户通信(例如,在用户与Web服务之间)和/或被配置为间接与用户通信(例如,通过信息源16的组 17在用户与第三方搜寻引擎M之间)。信息14可以是诸如(但不限于)如下信息对象类型电子文档(例如,含有正文和/或图像信息);网络消息(例如,诸如Web服务消息的其他网络11通信或者电子邮件);数据库内容(从远程17和/或本地210存储器(参见图4)获得的内容);和/或(例如)基于搜寻查询的搜索结果。如下文中进一步描述的, 认识到信息14可能包括应用程序(例如,Microsoft Word、PowerPoint、Excel、Outlook、
7Internet Explorer)的状态和/或应用程序的特定生成结果(例如,Word文档、报告、电子数据表、电子邮件、浏览器搜索结果)。应当认识到,信息请求18和信息响应20可能涉及诸如(但不限于)以下28信息查询数据库查询;文档(或者其他信息14)的结构化查询;以及Web(例如,网络11)查询。 认识到,当以结构化定义语言(例如,XML)存储越来越多的信息,以结构化定义语言交换越来越多的信息,或者通过各种界面以结构化定义语言提交越来越多的信息时,期望智能查询结构化定义语言数据源的能力。例如,可以将以结构化定义语言定义的信息14(例如,文档)称作结构化信息(例如,文档)并且因此,可以把信息14看作数据源并且可以把传统数据源(例如,数据库)看作信息14 (例如,文档)。如下文中进一步描述的,12可以包括具有与12相关的一个或者多个语义语境15和与其相关的信息14的可视外壳(例如,参见图4,在计算装置101的用户界面 202上的显示203)。当用户继续以12工作时,可以维持/开发其工作环境的可视方面以有助于表示与!^0R 12相关的语义语境15。同时,如下文中进一步描述的,基于用户正在创建或参考的信息14内容(例如,文档),通过语境引擎100(参见图2、来建立语义语境 15,或者相反地进行修改,以考虑从信息14所确定的信息语境19 (包括所确定的语境定义 105)。认识到,基于通过语境引擎100与信息14相关的信息语境19,当用户操作/访问本地创建/存储的(例如,用户创建的文档、信息请求18等)和/或从远程信息源16所获得的信息14的时候,语境引擎100可以动态地开发与12相关的语义语境15。在任何情况下,为了断定所选择的信息14涉及哪种(如果有)语义语境15,将系统10用于定义 FoR 12的语义语境15并且用于将从选择的信息14所确定的信息语境19 (例如,在创建语义语境15以后,由用户访问的文档)与12的语义语境15进行比较。认识到,语境引擎100可能确定信息语境19不与任何一种语义语境15匹配,并且因此,可以将信息语境19 作为基础来创建I^oR 12的新语义语境15。例如,语境定义104集合表示或者另外定义用于信息14集合的语义语境15的语义论题内容。例如,结合自一个或者多个文档的语境定义104表示指定给文档组/与文档组相关的总语义内容15。同样地,对于单独信息14部(例如,文档、Web页等),所确定的语境定义105集合表示信息14的语义论题内容,然后,将该信息接着用于与现有语义语境 15的比较目的,以确定单独信息14部是否涉及该语义语境15。换句话说,将独立信息14 部的语境定义105与语义语境15的语境定义104进行比较。例如,从文档所获得的语境定义105表示该文档的信息内容19。经由一个或者多个通信网络11 (诸如,内部网和/或外延网-例如,互联网)便于在用户装置101、信息源16、以及搜索引擎M之间的通信,并且由用户通过用户界面 202(参见图4)实现。如所期望的,系统10可以包括多个用户装置101、多个语境引擎100、 多个信息源16、多个搜索引擎M、以及一个或者多个耦合的通信网络11。认识到,语境引擎 100可以存在于用户装置101上(如通过实施例所示的)或者可以被配置为通过网络11由用户装置101容易访问的网络服务。信息请求18作为通过用户搜索和检索的信息14的实施例,以下论述使用通过通信网络11的信息请求18和信息响应20,从而通过语境引擎100来处理信息14 (可能包括相关的信息请求18)以使用所确定的信息语境19动态建立/修改与12相关的语义语境15。认识到,更普遍地,信息请求18和信息响应20还可能包括用于在用户计算装置101上本地创建 /修改/获得/存储文档和/或消息(和其他信息14)的用户活动。用户的请求18包括搜索参数22 (例如,关键词术语、词组等),以便在有助于从一个或者多个信息源16中识别适当地涉及已经存在于(例如,与其相关的)所定义的12 中的信息14的所期望的信息14。认识到,FoR 12的定义的初始/预备版本可能包括初始/ 预备信息14,诸如但不限于用户定义的标题和/或内容定义/描述;用户选择的文档(例如,来自本地存储器17);和/或用户从搜索响应20中选择的信息对象(例如,关于含有对于另一文档、网页或其他网络资源的索引或者导航元素、以及对于网页位置的索引和导航元素的搜索结果页的选择链接)。认识到,选择的信息14对象对于用户而言可能位于本地 (例如,诸如数据库的文件系统)或者位于远程(例如,经由互联网的访问的Web服务)。如下文中进一步描述的,语境引擎100可以使用初始/预备信息14,以构造12的语义语境15以便随后在分析由用户通过与其计算装置101交互所获得的后续信息14中使用。搜索请求18含有搜索参数22以有助于从信息源16中识别所期望的信息14,信息源诸如但不限于是以下各项图像文件、视频文件、音频文件、文本或者文学文件;文章/ 书籍评论;网页/网站;电子文档;网络广告;RSS种子;博客;和/或播客。用户通过网络 11提交搜索请求18,以定位潜在地涉及12的语义语境15的期望信息14。随后,可以通过语境引擎100来过滤通过搜索请求18 (例如,通过与至少某些搜索参数22匹配)返回的该信息14,以获得认为与用户兴趣最相关的信息14子集,即,与在语义语境15中所含有的语境定义104(参见图2、相关的信息14。还认识到,可以通过内容搜索模块106可选地增加搜索请求18的搜索参数22(例如,补充搜索请求18),以在向信息源16提交搜索请求 18之前包括至少一些语境定义104(以幻图示出)。可替换地,或者作为补充,在报告给用户以前,可以通过内容搜索模块106进一步分析基于用户提供的搜索参数22的、接收到的搜索结果20 (例如,来自基于Web的搜索引擎)。例如,内容搜索模块106可能使用至少一些语境定义104修改或者以其他方式对于在搜索结果20中所含有的信息14链接的排列进行重新排序。在一个实施方式中,接收到的其他信息(例如,来自经由网络11连接至用户的其他用户)可能是从以下的信息查询18所获得的信息14,信息查询诸如(但不限于)数据库查询;文档的结构化查询;和/或Web查询。接收到的其他信息可能基于用户请求18或者基于与用户交互无关地用户的语境引擎100的请求18。例如,引擎100的请求18可能是基于用户活动由引擎100发起的预测性查询,用户活动诸如但不限于当用户在参照系(例如,FoR 12)的语境15中时,但是在提交用户请求18以前;当用户在参照系(例如,FoR 12) 的语境15中时,但是在提交用户请求18期间;以及当用户在参照系(例如,FoR 12)的语境15中时,但是在提交用户请求18以后。此外,例如,当在已经进行任何搜索之前、期间、或之后用户处于语境15中时,可能发生直接通过引擎100的预测性搜索(例如,提交请求18)和相关的预测性检索(例如, 接收响应20)。引擎100可以根据在语境15中最确定的语境定义104的确定重要模式来构造查询字符串(预测性请求18的查询字符串)。搜索字符串可能为结合(例如,或的)在一起的非重叠模式的集合。通过与信息源16 (或者耦合至信息源16的诸如搜索引擎M的第三方服务器)的通信由引擎100发起搜索。注意,搜索字符串可能不用于与其他语境15 匹配,而是用于在语境15内的选择的语境定义104。然后,当用户打开12的相应的应用程序(例如,MicrosoftWord、Web Browser等)时,用户可被呈现搜索结果20。还认识到,语境引擎100可以使用搜索字符串。当不存在可用的语境定义104时,语境引擎100可以使用搜索字符串作为退化情况(例如,选择作为单个语境定义104),从而可以在可由语境引擎100使用的唯一信息(例如,用于语义语境15)的情况下把搜索字符串看作语境定义 104。此外,例如,当用户在其计算机上打开12的应用程序(诸如,网页浏览器或者文件资源管理器)或者其他应用程序时,在搜索文本框中的自动完成能力可以在下拉组合框中向用户提供搜索建议。例如,这通过使用从选自语境15的语境定义104的关键模式经由引擎100来实现,以为用户提供在用户可以从下拉列表中选择的基于语境类型的前面搜索/查询建议。请求18实施例系统10的用户可能使用语义语境15的语境定义104来使搜索请求18的搜索参数22具有倾向性,以提炼请求18和/或结果20的评价。搜索模块106可以将请求18的初始参数22与语境定义104进行比较,以确定在语境定义104中含有的词Wn是否包括至少一些搜索参数22。例如,当提交搜索请求18时,如果在用户的12的语义语境15中不存在相关的语境定义104,则搜索模块106(语境引擎106-参见图2、没有修改用于查询搜索引擎(例如,信息源16)的搜索字符串(例如,搜索参数22)。然而,如果在参数22和语境定义104之间存在确定的匹配,则通过搜索模块106 从语境定义104(例如,论题)中选择信息(例如,词、短语等)然后用于增加搜索请求 18(例如,查询)的参数22,然后将其发送至安排相应搜索的搜索引擎。换句话说,搜索模块 106可以利用从语境定义104中选择的内容(例如,确定的最重要的模式)附加参数22(例如,倾向的单词)的基本术语,以增加查询字符串。例如,这可能通过语境定义104(例如论题)执行语境定义104。在包括选择模式的单词最小化重叠的情况下,从最重要的语境定义 104(或者满足定义重要性阈值的另外的语境定义104)中选择最重要的模式(或者满足模式重要性阈值的另外的模式)。例如,通过搜索模块106接收对于Research h Motion (RIM),电信公司工作的用户搜索请求。在这种情况下,用户寻找RIM的工程师职位。然而,如果用户搜索“RIM工作”(例如,作为向搜索引擎所提交的搜索参数22),则至少对于在搜索结果列表中的较高排序结果的搜索结果20可能全部/大部分涉及性别材料。例如,在Microsoft Live Search 和Google上测试搜索请求“RIM工作”。Live搜索返回的搜索结果20在结果(每页约10 条)的前5页中没有包含就业机会的索引而Google搜索返回的搜索结果20在前5页中含有在第二页上的第一条、在第三页中的第二条的两条索引。通过将“RIM”和“ job”的搜索参数22与用户寻找职业处所定义的语义语境15的语境定义104进行比较来重复搜索请求18。语境定义104含有单词“工作”、“职业”、“工程师”、“职位”及其组合,和“性别”、“口才”等的排除/否定/限制语境定义104。搜索模块 106确定在搜索参数22和语境定义104之间存在匹配,S卩,这两者都含有单词“工作”。因此,搜索模块106利用来自语境定义104的匹配模式来增加基础查询18,从而搜索请求18 的查询字符串变为查询=(RIM+工作I RIM+职业I工作+工程师+职位非(性别I 口才等…)…)。基于选自语境定义104的内容而增加/修改的查询18使得搜索引擎106从所提供的所有搜索字符串中返回结果20。可选地,还对比语境定义104模式给结果20评分, 使得没有结果涉及性别内容并且返回涉及就业机会的所有结果用于用户在用户界面202 上审阅。认识到,可能基于选自语境定义104的内容(例如,单词Wn)修改基础搜索参数22 和/或可能基于选自语境定义104(例如,通过评分技术过滤性别索引,从而没有经由搜索结果20向用户显示的性别索引)的内容(例如,单词Wn)修改结果20。认识到,可能将系统10配置为使得在用户没有主动地做任何事情的情况下来开始搜索信息。由搜索模块106从语义语境15的语境定义104选择的匹配模式结合在查询字符串(例如,参数22)中,以催化该搜寻(例如,搜索请求18)。搜索模块106可能还给结果20评分并且用户以前摄方式得到结果(即,在用户方面不需要请求或者行动),从而向用户示出结果20的最相关信息,例如,将语境定义104用于排序搜索结果20。另外,如果用户访问选择信息14(例如,打开Microsoft word),则协作引擎150可以在与选择信息14的信息语境19相关的信息源16中搜索,然后提出显示了所认为的相关信息源16的任务窗格(例如,在用户界面202上)。下文中,对于协作环境140进一步描述的,认识到,所认为的相关信息源16可能包括被认为正从事相关材料(即,信息14的信息语境19与相关信息源16的信息语境19相匹配)的一些其他用户分组(例如,远离用户但经由互联网11可访问的)或者在用户企业中的同事。在另一实施例中,用户可能将语境定义104与其语义语境15 (该用户12的语义语境)相关联,表明用户从在线视频商店获得/审查一些记录片并且该用户是某一在线历史兴趣组的会员。因此,语境搜索模块106可以修改用户搜索请求18,以在搜索参数22 中包括来自定义表的语境定义104,其声明用户对纪录片感兴趣并且参加历史兴趣群(例如,使用指定的与用户的语义语境15相关的“记录片”和“历史兴趣”语境定义104)。包含这些语境定义104可以优选地对搜索结果20进行加权(例如,在更新搜索请求18以后所生成的的搜索结果,以包括“纪录片”和“历史兴趣”)以包括属于记录片和/或历史兴趣的信息14,或者按照其他方式,在随后搜索结果20中所包括的信息14的列表中使这些信息 14排序更高。通常,语境搜索模块106可能利用所选择的一些语境定义104 (或者至少从语境定义104中选取的单词/短语)修改搜索请求18,从而使搜索结果20更适用于用户。另一种选择是内容搜索模块106将搜索结果20与语义语境15的语境定义104进行比较,从而为来自搜索结果20、(例如)与语义语境15的语境定义104的阈值评分测量相匹配(经由其确定的信息语境19)的这些信息14提供较高排序。FoR 12系统10的一个特性在于其能够如用户所希望的而有助于建立、使用以及从
12中删除语义语境15。例如,在动态12的情况下,当用户搜索涉及多个不同语义语境 15的信息14时,语境引擎100可以确定正在查找的信息14的信息语境19是否与动态 12的现有语义语境15(或者,多个现有语义语境15)相匹配。如果匹配,则语境引擎100使用所确定的信息语境19的内容定义105作为附加信息,以建立/提炼语境定义104。可以将修订/修正/修改的语义语境15用于将当前搜索结果20的剩余信息14结果进行分类或者以其他方式对剩余信息结果进行过滤(例如,这使得基于改变的语义语境15来相应地改变当前检索结果的排序/内容),和/或可以将其用于过滤随后搜索结果20 (和/或修改随后搜索请求18的搜索参数22)。此外,基于在各个信息语境19的内容定义105和语义语境15的语境定义104之间的比较,如果正在查找的新信息14不符合现有语义语境15,则语境引擎100可能使用不匹配的内容定义105来自动创建新语义语境15。因此,当用户在数个语义语境15间切换 (例如,混合格斗、去牙买加旅行、专利保护等)同时与12互动时,可以将语境引擎100 配置为基于确定的语境定义105与现有语义语境15的内容定义104的比较结果来动态创建新语义语境15或者不断磨练现有语义语境15。此外,认识到,可以由系统10无限期地或者在所选择的时间段内(例如,直到在由多个家庭成员共享的计算机上关闭使用的所有浏览器窗口)使动态i^oR 12中创建的语义语境15持续存在。此外,参照图1,FoR 12可能包括在装置101 (参见图4)与定义的语义语境15相关的用户的工作会话。例如,工作会话可能包括如通过内容引擎100所维持的语义语境15, 以及内容引擎100与表示另一程序、或者程序集的图形用户界面(GUI)的互动,其中这些程序通过图标、窗口、工具栏、文件夹、壁纸/背景、和/或专用界面工具集向用户呈现。该程序或者程序集的一个实施例是被认为窗口管理程序或者包括窗口管理程序的一系列程序的桌面环境(例如,Microsoft Windows XP或者MicrosoftVista)。总体上,GUI有助于用户使用与实体世界(诸如按钮和窗口)互动时所使用的类似概念来与计算机程序互动。仅为了证明的目的,以下使用表示为桌面的!^0R 12。认识到,语境引擎100与由桌面所提供的一个或者多个程序合作,以经由语义语境15来优化基于用户正在进行的工作会话内的语境定义104(例如,论题)的用户信息14访问。认识到,当用户完成涉及定义的语义语境 15(其还可以与其他用户共享)的工作活动时,用户可以保存包括桌面程序状态的用户工作会话状态。可替换地,一旦完成用户的工作会话,可以删除语义语境15(以及对桌面程序的任何修改)。因此,12⑶I的用户交互特性可以包括应用程序状态项,诸如但不限于桌面图标;最近使用的用于窗口和应用程序的菜单项;网页浏览器爱好;以及维持状态的窗口桌面的其他通用特性。下文中进一步描述的程序修改器模块108可以经由语义语境15增加这些交互!^0R 12用户特性的状态。例如,程序修改器模块108可以使用语义语境15的内容定义104以重新排序最近使用的菜单项、网页浏览器爱好、以及维持状态的窗口桌面的其他通用特性,从而动态更新窗口特性以解释定义的语义语境15。例如,程序修改器模块 108将基于与一个或者多个语境定义104 (或者其他预先定义的定义匹配阈值)最匹配的这些爱好来修改列出的网页浏览器爱好的顺序,例如,在爱好列表中将与大部分语境定义14 匹配的爱好(例如,在定义104的指定阈值数量之上匹配的爱好)放置高于与语境定义104 较差匹配的爱好。以这种方式,将语境引擎100用于阻止经由12向用户呈现的混乱和 /或不相关信息14,这些混乱和/或不相关信息与涉及与当前定义的语义语境15无关的先前的方案/工作的信息14相关。在一实施方式中,在语义语境15创建中的第一步是用户识别语义语境15并且将信息14提供给语境引擎100以便在创建初始语境定义104中使用,认识到,用户可能实际上除了识别语义语境15以外不必做任何事然后可以没有从用户识别的任何初始定义/信息14的擦除而通过语境引擎100来建立语义语境15。还可以明确定义、命名语境15并将语境与桌面(例如,FoR 12)关联。例如,用户可以运行或者另外启动与语境引擎100(或者本地或者远程)的通信, 其为用户提供输入语义语境15的名称和/或描述。一旦开始,定义的语义语境15表示用于用户的特定方案的工作环境。可能通过语境引擎100使用语义语境15以包括用户工作环境(例如,桌面GUI)的可视和环境方面,以及例如用户正在工作的论题的方案的语义方面。虽然用户在!^0R 12中工作,但是语境引擎100可能在后台运行并且基于对于用户看不见的和/或需要用于修改/更新语义语境15的用户输入的用户活动来生成语义语境15。如上所述的,当用户在诸如对于商业用户通用的文字处理器、电子数据表、网页浏览器以及其他应用程序的应用程序中工作时,语境引擎100还可以保持应用程序状态信息。可以将该应用程序(包括诸如文档、搜索结果等的应用程序的生成结果)定义为包括所有类型的文档和其相关程序。例如,文档类型可能包括诸如但不限于Microsoft Office文档-Word、 PowerPoint、Excel、Visio、Access、Publisher、Frontpage、OneNote 等;在诸如 Microsoft Outlook的电子邮件/管理器程序中的电子邮件、日历事件、记录(在写字板上打字或者手写的)以及任务;网页和基于SGML的文档(例如,XML)的其他形式;数据库、数据库报告、 以及数据的其他示图;Adobe Acrobat PDF ;照片、扫描图像以及视频。应该注意,用户没有必要明确命名或者识别语境15。语境引擎100可以通过测量看起来用户感兴趣的材料的关联性(即,下文中进一步描述的语境定义104、105的计算)基于用户与系统10互动来暗示和创建语境15。此外,认识到,可以由语境引擎100保持的信息14的类型可能包括诸如但不限于 包括桌面(图标、背景、主题以及其他配置)的Windows、最近的程序(和诸如表示历史监控用户与应用程序互动的临时非独立状态信息的程序内部的状态信息)、最近的文档、我的文档、以及文件夹查看;包括我的爱好、书签、最近搜索、历史搜索、最近网页等的网络浏览器;以及包括在文件菜单中的最近文档的Office Applications、电子邮件、记事本、任务、 日历、联系人和电话(例如,在MS 0utlook、MS OneNoteNotebooks内)、以及文档管理系统索引和查询。语义语境15和信息语境19再次参照图2,与12关联的语义语境15包含用来存储用于定义语义语境15 的语境定义104的表(或者其他结构化存储结构)。认识到,语境定义104可能提供关于语义语境15的标识、分类、描述、和/或标签信息。例如,用户可能经由用户界面202(参见图 4)向语境引擎100提供初始定义104(作为代表期望的语义语境15而被处理的材料)以便在创建初始语义语境15中使用。认识到,用户还可能使语境引擎100从用户访问的信息 14中选择语境定义104,以便在创建初始语义语境15中使用。将语义语境15用于定义还称作搜索信息集154(参见图10)的多个信息14(例如,一系列搜索结果20以及由用户收集的其他文档)彼此相关的方式并且通过语境定义104来定义这种关系的方式。此外,用户访问的对于选择的信息14所确定的信息语境19具有用于定义信息14的语境的相关语境定义105。参照图8,示出了在系统10内的信息14的组织的示例性实施方式。由用户所收集的信息14的集合具有包括多个语境定义104的指定语义语境15。信息的集合还具有单独信息14 (例如,一个或者多个文档集、网页、网页链接-例如,浏览器书签等),每个单独信息均具有其自身指定的信息语境19。下文中进一步论述的语境引擎100还将语境定义104、 105彼此进行比较324(参见图7)以确定是否通过信息的集合包括新信息14 (通过在图8 中的重影项14、19来表示判定)。例如,包括用于佛罗里达的旅游、酒店、以及娱乐活动的网页的多个单独信息 14(例如,信息集合)将分配到具有“佛罗里达”、“低价旅行”、“推荐旅游胜地”、“帆伞活动”、 “佛罗里达冒险行程”、“迈阿密夜总会”、以及“佛罗里达旅游和娱乐活动”(作为结合所有其他语境定义104的超级论题的实施例)等语境定义104的语义语境15。单独信息14还通过指定的语境定义105具有独立的信息语境19,例如,旅游网页将具有表示其信息语境19 的信息语境105 “低价旅游”和“佛罗里达”,酒店网页具有表示其信息语境19的信息语境 105 “推荐旅游胜地”和“佛罗里达”,并且娱乐信息(例如,旅游手册文档)具有表示其信息语境19的信息语境105 “帆伞活动”、“佛罗里达冒险行程”、“迈阿密夜总会”。参见图10, 认识到,从用于还称作搜索信息集巧4的单独信息14的集合的语义语境15的语境定义104 动态收集单独信息语境19的语境定义105,并且语义语境还称作搜索语境156。如下文中进一步描述的,当用户获得新信息14(例如,推荐的佛罗里达所有旅游胜地的列表)时,语境引擎100确定用于新信息14的信息语境19的语境定义105(例如,“旅游胜地”、“最佳推荐”、“佛罗里达”、“包括一切的”),然后进行比较以确定是否通过信息集合和语义语境15添加/收集新信息14和/或其信息语境19。认识到,语境定义104、105可能提供关于信息14的标识、分类、描述、和/或标签信息。认识到,用户可以使语境引擎100确定用于由用户访问的信息14的语境定义104、 105以便在创建信息语境15、19中使用,和/或用户可以指定在生成语境15、19期间由语境引擎100使用的语境定义104、105。例如,用户可以在信息14中选择一些单词或者单词组合,在确定语义语境104、105中使用。例如,语境15、19可以包括超级论题、论题及模式(例如,语境定义104、105),其中,每一个均根据另一个来建立(即,由论题来建立超级论题,由模式来建立论题,从而超级论题可以被认为是论题的进一步概况)。每个模式均包括在模式中的单词和在分析文档 (例如,信息14)中的单词相对频率。通过参照发现该结构的文档(例如,信息14),将这些结构(例如,超级论题、论题、以及模式)添加在存储器210中。此外,通过在存储器210中指向全局词典109(参见图2)的关键字来表示该结构的所有单词,全局词典包括识别每个单词Wn的语言全局统计、其唯一指示符In(例如,唯一整数或者其他值)以及在包括每个单词Wn的全局单词集(例如,语言)中的其全局自信息(例如,相对频率)。认识到,全局统计可能来自该语言的单词Wn使用和/或来自通过文档主体的训练。你还可以在给定了单词Wn使用的任何差别的词典109中具有医学、法律、以及(专门(例如,技术))倾向。随后,可能允许用户104明确(例如,提供实际单词/短语)或者隐含地经由信息 14的关联来监控(例如,添加、修改、或者删除)语境定义104,其中,信息14的关联包括在确定语境定义104期间通过语境引擎100使用的潜在单词/短语。例如,用户可以命令语境引擎100包括一个或者多个文档内容以便在创建或者另外修正12的语义语境15期间使用。还认识到,语境引擎100可以自动(例如,没有接收来自用户的指示)包括由用户访问的信息14,以便在确定语义语境15的语境定义104期间使用。除非另有建议(例如,通过语境引擎100),否则用户可以希望在搜索请求18和/或结果20的随后处理中主动关联/使用语境定义104。再次参照图2,基于内容分析器模块102的模式识别算法(例如,模式集群和规则集103的数据分组)通过信息14来确定语境定义104。模式识别从对于与语义语境15关联(或者潜在关联的确定)选择(或者另外为了比较目的选择)的信息14提取包括确定的语境定义105的信息语境19,然后模块102使用确定的语境定义105动态更新语境定义 104。语境定义104、105可以是用于使信息14的内容分类或者另外标注信息14的内容的单个/多个字母和/或数字描述符(例如,单词),从而内容引擎100可以将信息14与用户手头项目的语义语境15进行最佳匹配。语境定义105是与信息14 (例如,文档、图片、 文章、视频剪辑、博客等)相关的或者另外指定给信息14的(相关)单词或者术语或者短语(和其模式),因此描述信息14并且能够使信息14的基于描述/单词分类作为信息语境 19。例如,可以将语境定义104、105定义为包括η阶模式,其中,一个单词为第一阶模式,两个关联单词被认为是第二阶模式,三个关联单词被认为是第三阶模式,四个单词被认为是第四阶模式,以及五个关联单词被认为是第五阶模式等。如下文中进一步描述的,语境定义104、105由在单词模式/分组中包括的单词组成。语境定义104、105由选择的(例如, 基于模式重要性阈值)单词模式形成,该单词模式已经由选择的(例如,基于单词重要性阈值)单词形成。例如,模式映射至将何称作一个关键词的情况是存在第一阶模式的情况。此外,虽然信息14的相关性测量可以表示其与语义语境15的相关性(S卩,比较语境104、105以判定在选择的单独信息14和语义语境15的信息14之间是否存在匹配),还可以创建否定/过滤语境定义104,以从与语义语境15相关的信息14集合中过滤不期望的信息14内容。例如,否定语境定义104、105可以包括对于广告材料、色情材料或者由用户识别为不期望的简单材料的定义。为了有助于识别不期望的材料,用户可以创建否定语境定义104、105并且指示语境引擎100将他们分配至单独信息14的各个信息语境19和/或表示信息14集合的语义语境15。此外,语境引擎100可以基于通过语境引擎100使用的否定/过滤材料(例如, 单词、短语、指定文档等)建议(例如,通过用户)来自动识别和分配否定/过滤语境定义 104、105。例如,用户可以指定含有令人反感的/不期望的材料的信息14(例如,大量网站 /网页、文档等)。然后,语境引擎100将使用分析器模块102确定对于经识别的不期望材料的信息语境19的语境定义105。用户可能允许语境引擎100自动将这些确定的语境定义 105 (表示不期望信息14)分配给语义语境15的语境定义104和/或可以主动地选择应当分配哪些确定的语境定义105。用户还可以建议由语境引擎100使用的一些单词和/或短语,以协助可疑信息14的语境定义105的生成。例如,用户可以强制语境引擎100使用指定单词(例如,“性别”、“广告”等),否则该指定单词由于缺少对于与指定单词/短语关联的指定单词/短语和/或模式所确定的重要性可能从语境定义105生成处理(下文中所述的)被剔除。认识到,在表示不期望信息14的确定的语境定义105的情况下,将确定的语境定义105添加至语义语境15,但是可能没有将相关的不期望信息14添加至与语义语境15相
15关的信息14集合。否则,可以将不期望/过滤信息14添加至过滤信息文件夹,用于用户预览以有助于估计语境引擎100在识别不期望材料中的性能。因此,可以在否定语境中包括否定/过滤语境定义104、105并且与为代表用户所希望的材料(例如,信息14集合)的当前语义语境15相关联。每个语义语境15均可以既为与语义语境15相关联的肯定语境定义104又为与语义语境15相关联的否定语境定义104。同样地,全局信息集109(参见图 2)还可以具有用于自动/手动选择语义语境15的任何数量的全局否定过滤器(例如,语境定义104)。全局否定过滤器的实施例可能涉及广告术语和材料或者涉及色情材料。例如,每种语境15可以具有与其相关联的否定语境。除了用户已经识别不期望材料(例如,用于识别否定语境定义104的信息14)以外,可以按照与肯定语境相同的方式将材料添加至否定语境。在比方说色情的其他过滤器的情况下,否定语境定义104可以为全局的(例如,在词典109中列出)并且用户可能不需要采取任何行动来创建由系统10(例如,将具有不期望模式的语义语境15载入词典109)访问的预先定义的全局过滤器(包含在词典109中可用的全部或者选择部分的否定语境定义104)。最终,信息14的评分可能为少于否定语境评分(即,从信息14所获得的语境定义105与语义语境15的否定语境定义104匹配)的肯定语境评分(即,从信息14所获得的语境定义105与语义语境15的肯定语境定义104匹配)。如果模式在肯定语境定义和否定语境定义104、105下重叠,则对于在肯定方的模式(但没有排除)可以减小信息14的评分。因此,认识到语境15可以具有与其相关联的肯定和否定语境定义104这两者。可以按照SQL数据库格式(例如,Microsoft SQL 2005)存储语境定义104、105, 以存储所有的语境信息104、105。SQL数据库格式是用于在相关数据库管理系统(RDBMS) 中检索和管理语境定义104、105的一个实施例。SQL数据库格式通过检索、插入、更新、 以及删除在存储器210中的语境定义104、105数据来提供查询和修改语境定义104、105 数据并且管理数据库(例如,存储器210-参见图4)。用于访问在存储器210中的语境定义104、105的SQL语言可能包括以下示例性语言要素,例如但不限于=Statements (语句),其对于存储器210的图式和数据可以具有持久影响,或者其可以控制事物处理、程序流程、连接、会话、或者诊断;Queries (查询),其基于特有标准检索语境定义104、105 ; Expression"表达式),其可以产生由用于语境定义104、105的数据行和列组成的表格或者标量值;Predicates (判定),其能够指定可以被评估为SQL三值逻辑(3VL)布尔真值的条件并且该条件用于限制语句和查询的效果,或者用于改变程序流程;Clauses (条款),其为语句和查询的组成成分(在任选的某些情况下);WhiteSpace(空白符),其可以在SQL语句和查询中忽略。在另一实施方式中,语境定义104、105可以为涉及描述符与对象关联的元数据并且可以体现为用于定界元素的开始和结尾、元素的内容、或其组合的句法(例如,诸如编码语句的HTML标志/定界符)。可以使用诸如但不限于定义可以根据其逻辑结构(标题、段落、或者思想单元等)如何描述文档的标准通用标记语言(SGML)的结构化定义语言来定义语境定义104、105。因为SGML提供了 “如何描述语言的语言”,因此SGML通常还称作元语言。SGML的特定用法被称为文档类型定义(DTD),其精确定义了所容许的语言。例如,超文本标记语言(HTML)是用于定义语境定义104、105的结构化定义语言的实施例。结构化定义语言的另一实施例为可扩展标记语言(XML),其定义如何描述数据集合。因此,可以将语境定义104、105用于提供语境15、19的底层定义/描述,还有助于定义用于生成或者另外操作(例如,修正、查看等)信息的14的12应用的状态。例如,可以将HTML定界符用于围绕关于HTML页的描述语言(例如,语境定义104),其作为标题部分位于Web页中HTML 的顶部附近。认识到,由语境引擎100使用语境定义104、105这两者,以识别适用于搜索请求18 语境的相关信息14,以及组织与信息14关联的12应用的状态(例如,组织Outlook中最贴切的电子邮件、组织Word中最相关的文档、组织最相关的浏览器链接等)。还认识到, 如下文中参照处理300(参见图幻进一步描述的,可以使用根据信息14所确定的语境定义 105以有助于相对于语义语境15的语境定义104对信息14排序,即,在根据信息14所确定的语境定义105与语义语境15的语境定义104之间的类似度。认识到,如果在信息14的语境定义105与语义语境15的语境定义104之间发现合适的类似度,则可以将信息14的语境定义105添加至语境15的语境定义104,以更新语义语境15从而表示信息14是通过语义语境15所表示的用户的信息14集的一部分。还认识到,用户可能已经将任何不相关的信息14 (例如,文档)添加至与语义语境 15关联的信息14主体。可能存在以下情况,其中,系统10对在与语义语境15关联的信息 14的主体中的从属关系来预先测试(例如,识别语境定义105然后将其与语义语境15的语境定义104相匹配)信息14,或者仅将信息14添加至与语义语境15关联的信息14主体, 而不考虑信息14是否含有匹配语境定义105。例如,用户可以对于系统10简单指定应添加信息14。认识到,在其他情况下,当已经处理信息14的内容并且具有已经视为拥有了标识其作为相关材料的评分时,系统10将仅添加信息14。语境引擎100参照图2,当用户工作以在12内创建或者编译文档和其他数据时,语境引擎 100管理并使用语义语境15的语境信息。分析与语义语境15关联(手动、自动、半自动) 的每个用户操作信息14(例如,文档)。由语境引擎100使用12语境定义104、105,以引导并且添加网络搜索18和/或然后区分搜索结果20的先后顺序,是否该结果在整个互联网11上、或者位于本地企业(例如,计算机本地网络)或在用户自己的计算机101上。为了协作目的,经由协作引擎150,可以将语义语境15和/或信息语境19的该论题信息用于找到在企业中正在从事相同主题的同事而同时例如遵守隐私和安全策略。如所期望的,参见下文中描述的协作环境140,还认识到可能便于在互联网11上的系统10的用户和其他用户之间的协作。另外,在所希望的情况下,语境引擎100使用这些确定的论题(例如,语境 15,19)以对信息14和其关联的12程序分类并且对其进行注释。在向企业搜索引擎M 和/或文档管理系统提交信息14(例如,文档)之前,可以在企业中完成信息14的注释。例如,可以将系统10配置为存储或者另外将确定的信息语境19与存储在存储器210(例如, 通过数据库表示的)中各自信息14关联。为了动态修改12的语义语境15,可以积极或被动引导语境引擎100以包括用于通过内容分析器102(参见图2)分析的用户操作信息14。积极引导的实施例是用户选择要分配给语义语境15 (例如,用于有助于通过语境引擎100进一步定义/生成12 的语义语境15)的一个或者多个信息14。被动引导的实施例是将语境引擎100配置为自动选择(例如,没有用户手动互交互)通过在与信息源16和/或本地存储17交互中用户所操作的(例如,创建、修正、存取、或者另外获得等)任何信息14。例如,语境引擎100可以确定根据用户从搜寻结果20列表中选择(例如,通过从列表中点击链接)的这些搜索结果20所确定的适当的语境定义105,并且将这些适当的语境定义105添加至语义语境15, 同时进行选择以忽略用户没有从搜索结果20列表中选择(例如,没有从列表中点击链接) 的那些搜索结果。还认识到,例如可以使用向用户提供接受或者拒绝所选择的信息14与语义语境 15的关联的能力的显示提示,通过语境引擎100向用户自动建议在语义语境15生成中使用的信息14选择。认识到,当选择要与语义语境15关联的选择信息14时,语境引擎100确定常驻在选择信息14中的任何语境定义105(经由内容分析器10 ,以这些新确定的语境定义105更新语义语境15的语境定义104,从而提供语义语境15的动态更新能力。认识到,选择信息14与12的语义语境15关联的另一实施方式可以是使用基于时间的被动引导。例如,如果用户继续停留(即,与其交互)在目的源上长达大于预定时段(例如,45秒),则可以将搜索结果20用于积极地精炼语义语境15的语境定义104,如果用户在预定时段内(例如,5秒)关闭目的源,则可以将搜索结果20用于消极地精炼语义语境15的语境定义104。此外,例如,当用户将信息14 (例如,实际文件或对于信息14的链接)移动至诸如“我的文档(My Document)”或者用户桌面的12的监控区域时,信息 14(例如,文件或者网络内容)的信息语境19可以自动添加至语义语境15。在网页作为信息14的情况下,将信息添加至浏览器应用程序的“我的爱好(My Favourites) ”将自动将关联信息语境19添加至语义语境15。认识到,还可能存在与12的其他应用程序关联的其他众所周知的位置(例如,监控区域)。参照图2,示出了语境引擎100的一个实施例,其用于处理搜索请求18、向用户100 提供搜索结果20、以及基于常驻在用于认为的这些新获取的信息14(通过语境引擎100和 /或通过用户手动)的搜索结果20的新获取的信息14中的确定语境定义105更新语义语境15ο语境引擎100包括内容搜索模块106,用于接收搜索请求18和/或用于处理(例如,通过根据语义语境15的内容添加额外参数22来修正搜索请求18的参照22 (参见图1)) 的搜索结果20 ;内容分析器模块102,用于为了确定常驻其中的适当的语境定义105(根据语境确定规则的集合10 来分析搜索请求18、搜索结果20以及与用户交互的任何其他信息14的内容。如果确定了根据信息14所确定的新语境定义105不与语义语境15的任何一个语境定义104匹配,则将内容分析器模块102配置为用于使用非匹配语境定义105来创建新的语义语境15。此外,还包括程序更新模块108,其用于更新与102关联的任何应用程序的状态。内容分析器模块102内容分析器模块102可以被指令为经由通过用户界面202 (参见图4)所提供的菜单分析用于任何常驻语境定义105的特定信息14。优选实施方式使用托盘图标来允许用户访问语境菜单,其便于选择与语义语境15关联的信息14。作为实施例,可以暗示和/或明确进行要包括在语义语境15中的信息14内容的识别。明确包括的内容是由用户所识别的信息14(例如,文档)。例如,通过用户在文件或者文件夹上“点击右键”然后选择添加至语义语境15的菜单选项将导致选择的信息14对于用于语境定义105分析的内容分析器模块102可用。此外,可以通过在12内监控通过用户创建或者访问信息14(例如,文档或者其他数据源),利用语义语境15暗示地包括信息14内容。否则,可以通过检查信息14位于本地存储器210何处(和/或信息来源于何源16),利用语义语境15暗示地包括信息14文档。例如,可能经由内容分析器模块102暗示地在语义语境15中包括位于用于12的我的文档文件夹中的信息14。另一选项是对于网页,可以通过用户简单查看网页(例如,长达预定时段)或者通过用户由在语义语境15中应该包括页(URL)的基于工具栏的控制识别来暗示在语义语境15中包括这些网页。此外,内容分析器模块102使用模式群集和数据分组算法(例如,规则集103)以从要作为在修正语义语境15的语境定义104中使用的新语境定义的选择信息14中选取关键论题(例如,语境定义105)。在协作(例如,匿名)的情况下,参见图10,实施例可以是用户Un共享搜索结果 20和/或搜索信息集154。当用户Un搜索互联网和/或文件系统(例如,数据库)时,模块102基于用户Un的活动建立语境定义104、105数据,用户Un的活动触发正添加至语义语境15的材料。这些触发可能包括在浏览器中读取结果、将结果20 (例如,文档)识别为相关或者非相关(例如,结果20存储在预先定义的文件夹或者应用文件中)、书签结果20 或者将链接添加至用户文件系统。认识到,例如,模块102可以通过监控文件系统和浏览器行为来跟踪用户的活动。内容规则集103参照图2和图5,示出了由内容分析器模块102所使用的示例性内容规则集103, 内容分析器模块用于从要用作在修正或者另外创建语义语境15中使用的语境定义105的选择信息14中提取论题(例如,诸如但不限于单词和单词分组的正文部17)。认识到,在正文部17中包括两个以上单词的情况下,这些单词可以在信息14的文本中彼此邻近(例如,认作多词短语),可以通过在信息14的文本中位于中间的一个或多个单词彼此分离,或者其结合。还可以将语境定义105称作分析信息14的自信息。可以根据取决于在确定自信息中所使用的表达式中使用的对数的基数,将自信息称作与以例如位的信息单位所表达的随机变量结果关联的信息内容的测量。例如,在概率事件中所含有的自信息数量可能取决于该事件的相对概率/频率,即,相对概率/频率越小,与事件真正出现的接收信息关联的自信息越大。此外,自信息的测量可能具有以下性质如果事件C由两个相互独立事件A 和B组成,则表明C已经发生的信息量等于分别表明事件A和事件B的信息量的和。考虑到该性质,可以将与结果ωη关联的自信息Ι(ωη)(以位测量)确定为 {ωη) = Iog2 ( 1 ) = -Iog2 (Pr( ))
Pr( )在信息14处理的语境下,例如,IL(Wn) = _log2 (Pr (Wn)),其中,Pr是在信息14 中(例如,在文档中或者在诸如部分、段落、页等的文档子集中)找到单词Wn(或者其他正文部)的概率(例如,相对频率)。此外,对于在信息14 (例如,文档)中的每个单词/正文部Wn,可以将用于单词/正文部Wn的重要性IMP(Wn)测度确定为IMP (Wn) = IG (Wn) -IL (Wn),其中,IL(Wn)为单词/正文部Wn的局部自信息(LSI) ,IG(Wn)为单词/正文部Wn
19的全局自信息(GSI)。换句话说,局部自信息(LSI)可以描述为在考虑中的局部信息14(例如,文档)中单词/正文部Wn发生的相对概率/频率描述,并且全局自信息(GSI)可以描述为在全局信息109集(例如,定义为诸如词典的单词和/或短语的词汇表的语言,文档和/或者其他信息源的分组等)中单词/正文部17发生的预先定义的(例如,已经已知的)相对概率/频率。可能基于在选择文档中发生的其相对概率/频率以及其在可以包括来自除了选择文档 (或者除了选择文档以外)的文档的(例如文档的分组、词典等)的单词/短语的全局信息 109集中发生的相对概率/频率这两者来确定选择的正文部17的重要性测量。鉴于以上所述,将在选择信息14中的单词的相对局部频率与在选择的信息14中其他单词相比较(用于计算I局部中使用的)并且将全局单词集(例如,词典109)中的单词的相对频率与在全局单词集中的其他单词(在计算I全局中使用的)相比较。将全局单词集表示为如下语言,其可以符号化为可以根据其来计算全局相对频率值的文档集合。将这些全局值存储在用于在词典109中含有的每个单词的词典109中。重要性计算考虑在信息14中的单词的相对频率与其在标准语言使用或者文档训练集中的相对频率相对。在优选实施方式中,局部自信息与全局自信息之间的偏差提供这种测度。认识到,在词典109中含有的单词Wn可以包括在信息14 (例如,通过用户)内识别 (例如,通过用户)的行话或者用户定义术语。可以为这些用户识别的单词Wn给定或者另外分配(例如,通过语境引擎100)非常高(例如,与在语言中很少出现的单词Wn相对应) 的默认全局自信息,因此,这些识别的单词Wn可以作为任何其他单词处理。此外,词典109 可能体现为含有多种语言和/或特定词典。此外,例如,将GSI描述为在普遍语言中使用的单词(例如,英语)。用于词典109 中的GSI来源于处理在大量跨该语言的书籍和文档中所含有的单词的相对频率。对于每种语言,可能存在含有对于用在该语言中的单词已经计算的GSI测度的词典109。当可能出现在与工程、法律、或者医学材料相关的文档中的时候,对于语言的非标准应用可以计算不同GSI。在这种情况下,可以将用于单词的GSI分配给从例如具有医学偏爱的材料训练的单词。认识到,在任何情况下,鉴于在全局信息集中的内容定义105的相对频率(例如, 全局相对频率),通过考虑在信息14中的内容定义105的相对频率(例如,局部相对信息) 进行正考虑/分析的信息14的内容定义105的确定。再次参照图5,在作为用户与12互动/工作活动的结果,向语境引擎100提交信息14 (例如,一个或者多个文档、诸如来自搜索引擎或者文档管理系统的搜索结果列表、 诸如来自文档的段落的文本部、诸如我的文档的兴趣位置或者在用户文件系统中的兴趣其他位置的存在等),或者另外通过语境引擎100接收信息14的情况下,规则集103可以包括步骤300。在步骤301处,在每个事件21均可以是公认的(例如,或者静态地或者动态地预先定义)文本的逻辑单位的情况下,处理信息14的内容以创建一系列事件。例如,在良好形成的信息14集中,这种公认的/识别的逻辑单元可以为句子、段落、或者连续段落、页或者多页、PowerPoint中的文本行(点)、单元、在用于HTML(或者其他网页/内容)的MS ExceKExcel的用户对其熟悉)的其他逻辑描绘或者行、在网页/内容主体内句子组合、和 /或在信息14中(例如,在页中)逻辑分组的文本块。因此,在信息14中事件21的识别/认识可能基于用于事件21的定义机制,该定义机制诸如但不限于标点符号(例如,句号或者逗号);空格(例如,制表位或者空格);元数据(例如,标志和/或用于定义事件21文本内容的开始和/或结束的定界符);文档中断(例如,分页符、分行符等);以及本领域中众所周知的其他定义机制。认识到,信息14可能为一种或者多种格式(例如,PDF、MicrosoftOffice格式、 HTML、XML、以及其他类型SGML及格式)。此外,认识到,事件21结构可以使用在文档内的诸如段落的其他结构或者在诸如<DIV>、
等的网页(例如,HTML)内的逻辑分类,这表示在信息14内的逻辑分组文本或者信息14的定义部。信息14可以包括多种语言或者单种语言。因此,认识到,可以作为独立语言实现规则集103。另外,当每个单词添加至事件21 列表时,可以阻止每个单词。例如,将stop、stops、stopped、stopping全部添加至事件21 列表作为stop ;但是可以将stopper保持为stopper。认识到,每个正文部17可能属于一个或者多个事件21 (例如,单词为句子的一部分,句子为定位在一页或者多页上的段落的一部分,页为章或者其他定义信息14部的一部分)。在每个事件21均包括作为文本串形成每个事件21的单词(例如,被阻止的)和术语/短语的列表的情况下,步骤301的结果为形成信息14的事件21的列表。因此,步骤 301用于将信息14分成一系列文本串,S卩,表示识别事件21的内容,以使文本串的每个集合均表示认为信息14的文本的逻辑分组块的各个事件21。因此,认为信息14的每个公认/ 识别事件21含有一个或者多个正文部17。在步骤302处,对于在信息14(现在表示为事件21的列表)中的每个正文部 17(例如,单词或者短语),例如,计算局部自信息IL(Wn) =-log2(Pr(ffn))其中,ft·为在信息14中局部找到的正文部17Wn的概率(例如,发生的相对概率)。接下来,对于在信息 14中的每个正文部17,例如,计算用于正文部17的重要性测度IMP(Wn) = IG(Wn)-IL(Wn)其中,IL(Wn)为正文部17的局部自信息(LSI),IG(Wn)为正文部17的全局自信息(GSI)。认识到,可以在保持用于语言正文部17的预先定义的GSI值的全局信息109(例如,可以存储在数据库表中的词典、或者在存储器210中的任何其他数据结构-参见图4) 中保持用于正文部17的GSI的预先定义值111。例如,认识到,可以通过处理大量文档(或者其他信息源14)来训练用于全局信息Iio中的文本部17的GSI的预先定义值111,以获得代表在语言中使用的文本部17(例如,单词/短语)的统计表(例如,该统计表可以源于正文部17相对于该语言中其他正文部17的发生频率的频率数)。此外,作为从全局信息109中所获得的唯一整数或者其他代表值(例如,混列码、⑶ID、…)“In”与信息14中的每个正文部17(例如,单词Wn)关联。 该整数/值对于存储在全局信息109(例如,词典)中的每个正文部17是唯一的。因此,正文部107的每个单词映射至全局信息109中的代码h。如果对于遇到的正文部17不存在代码In,则在全局信息109中附加代码化输入项。这可能发生在信息14 中出现的俚语、绰号、缩写词等。此外,认识到,如果所识别的正文部17的使用被认为是重要的,则仅实现这些新添加的代码In,并且因此,在将要使其通过语境定义104、105生成的模式中涉及该代码h。为了清晰,可以将代码h分配给信息14中的每个单词Wn (以及定义的词组-例如,共同考虑组成短语的单词的情况下的医学短语或者其他技术短语)。一个这种实施例为术语“副神经”,从而将单词副和神经的组合一起用于定义神经类型。在这种情况下,全局信息109可能具有用于“副神经”的输入项,其具有用于将该输入项处理为单词组合(例如,短语)的指定代码h。通过从全局信息109中所获得的其对应代码h来表示在事件21(例如,句子)中的每个单词(或者预定义词组)。同样地,应该理解,还将用于单词和词组的GSI存储在全局信息109中并且由模块102通过查找来取出。认识到,鉴于在事件21中的单词或者预先定义的词组的上述实施例,如所希望的,可能或者不可能将合成术语配置为通过系统10使用。例如,如果认为识别的合成词重要(例如,满足重要性阈值),则用户可能使用用于在处理信息14的识别模式下自动识别合成词(例如,词组)的语境引擎100。步骤302的结果为将唯一值In (例如,整数)分配给在信息14中所识别的每个正文部17并且对于在信息14中所识别的每个正文部17已经计算了 GSI、LSI、以及IMP。因此,除了表示为文本串的事件21的原始列表以外,现在可以呈现所有值(例如,整数)事件 21列表。如所描述的,每个事件21 (文本的句子或者其他块,例如,段落、节、章)由在信息的事件21中呈现的单词Wn的列表组成。然后,信息14成为事件21的列表,其中,每个事件21都为表示在事件21中的每个单词Wn (或者预先定义的词组)的代码h (例如,整数) 的列表。如下文中所述的,在信息14内的事件21之间找到模式。此外,已经把像“1(我)” 和“am(是)”的单词视为完全没有具有实质信息内容,因此在关联挖掘以前,类似这些单词可能决不将其制作为模式并且结束从单词列表中剔除。还认识到,可以将与局部计算相对的全局用于剔除一些单词Wn。剔除这些典型单词,但是可能存在(或可能不存在)要剔除的预先定义的单词Wn的专用表。规则集103的下一步骤304是鉴于在信息14中存在的一些正文部17相对缺少关于在信息14中存在的其他识别正文部17的重要性,而将其剔除/删除。换句话说,正文部17的IMP(IMP = GSI-LSI)提供在正在考虑中的当前信息14内的正文部17的重要性测度。通常,IMP越高(在正文部17之间的相对重要性的实施例),则正文部17对于正在考虑中的信息14的信息内容越重要。该技术的一个优势在于,可以从基于信息内容的进一步处理中剔除正文部17。这可能还自动包括可能被认为含有相对可以忽略的信息(即,与认为在全局信息109中相对很少常见/共用的其他正文部17相比较,通过具有在全局信息 110中所分配的较低值所表示的)的例如冠词和连词的单词(例如,the (这个)、and(和)、 but (但)、or (或)…)。认识到,例如相反地,认为在全局信息109中相对很少常见/共用的正文部17更重要,因此具有比认为含有/表示相对可以忽略的信息的正文部17的值的较高分配值111。还认识到,如所希望的,与用于更不重要的正文部17的更高值相比较,可能向更重要的正文部17分配更低值111。因此,使用分配值In(和其计算的LSI)可以进行从信息14的内容中滤除或者另外的去除考虑的一些正文部17,而没有通过使用专用词典(或者其他单词列表)来识别要过滤的特定正文部17。因此,在信息14(例如,文档)中的正文部17(例如,单词)每一个均从全局信息集109接收通过其分配值111的类似处理。因此,可以通过正文部17确定的 IMP值相对于包含阈值的IMP的比较来进行从信息14的内容中滤除一些正文部17 (例如, 小于包括阈值的IMP的用于正文部17的任何IMP值为通过进一步考虑去除的正文部17的候选者)。此外,还实现了可以通过考虑其GSI值并且使用重要性阈值和要剔除的GSI阈值进行该过滤。因此,可以将重要性阈值用于确定将从信息14中剔除以下哪些单词。可以调整该阈值以增大或者减小剔除的正文部17的百分比。例如,为了减小对于稍后步骤中所执行的模式集群和数据分组(POTG)的计算要求,可能期望基于正文部17的总事件21计数(含有正文部17的事件21数)或者在信息14内的唯一正文部17的总数来增加从信息14中所剔除的正文部17的百分比,例如,正文部17仅在信息14中出现有限次数(例如,一次)。 大信息14集通常含有比更小信息14集更多的句子(例如,事件21)和唯一单词(例如,正文部17)。步骤304的结果是用于信息14的事件21列现在含有具有最高IMP的正文部17 的子集(即,通过下文所述的模式发现步骤306中进一步考虑重要性而没有剔除/去除的正文部17)。接下来的步骤306是用于在信息14中发现/识别正文部17的模式并且去除认为不如其他更显著模式那样重要的那些模式。在步骤306中,计算在信息14中所含有的所有模式(例如,定义为在一个或者多个正文部17之间的确定关联性)。可以将模式描述为在多个事件21中出现的一个或者多个正文部17中发生。例如,可以在模式收集/识别中设置多个模式阈值。可以将模式的频率设置为阈值。例如,如果模式没有出现多于某次数,则将从模式列表中把该模式排除在外。同样地,可以将模式阈值设置为相对频率模式阈值,其中,仅选择相对最高频率数(例如,通常最高出现5次)进行进一步处理。认识到,模式的一个实施例为在两个以上不同事件21中重复两个以上正文部17 (例如,在多个不同句子中共同找到两个单词,因此指示它们彼此具有某种关系)。还认识到,在事件21中的正文部17的相对定位/位置可能便于模式识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要 (例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题中找到一个单词等。例如,可以将用于小文档的值2和用于更大文档的3用作频率阈值。此外,可以将第 1阶模式(例如,可以将模式的阶定义为在模式中的单词(正文部)数量以使第1阶模式具有一个单词,第2阶具有两个,第3阶具有三个等…)用在较小文档中以有助于取在计算论题中可用的模式数量最大值。在较大文档中,可以使用第2阶和更大模式。例如,语境引擎 100可以配置模式挖掘以在第5阶模式处停止。认识到,如果降低模式阶,则空间相关的模式仍可以聚集在一起。认识到,用于在事件21中的正文部17的GSI和LSI值的整数表示可能有助于提高计算模式的计算性能。还认识到,作为在步骤304中进行计算和剔除的结果,在步骤306 中所计算的模式可以由可能与信息14最相关(例如,具有最大IMP)的正文部17组成。因此,在步骤306中发生模式挖掘以前,从事件列表中去除具有低IMP的正文部17(即,那些被认为不满足重要性阈值的正文部)。这可以减少包括无意义单词Wn (例如,the(这)、 this(这)、were(是)等…)的模式数量并且可以减少用于随后找到模式的计算然后加权、 计算重要性,然后挑选这些模式。还认识到,步骤304可以为在确定语境定义104、105中进行的可选步骤。此外,对于每个模式,引擎100可以计算识别模式的重要性(P-IMP)。该计算的第一步是要计算用于每个识别模式的模式权数(PW(Pi)),例如像PW(Pi)=包括模式的正文部17的IMP的和(或者其他数学组合),同样地,P-IMP(Pi) = P-GSI-P-LSI和P-LSI =-log2 (Pr (Pn) )*PW (Pi)。同样地,在用于正文部17的GSI的情况下,可以通过利用大量文档训练来计算 P-GSI。例如,ft~(Pn)为在信息14内找到模式的概率(例如相对频率f发生)。就像单词可以建立模式的全局信息109 —样,可以根据文档来训练模式。例如,可以基于文档训练结果向用于每个正文部17的GSI值分配独立GSI值或者分配用于所有模式的常量。在任何情况下,认识到,如在全局信息109中指定的,GSI值对于每个正文部17可以相同或者不同。 在当前实施方式中,语境引擎100使用M.0作为用于模式的全球自信息GSI的示例性占位符。例如,选择M的原因其是表示在16000000中找到低于1的模式的概率的数字。该数字意味着任何P-GSI-P-LSI大于0。步骤306的合成计算为语境引擎100具有模式的有序列表,以使模式的P-IMP越高,则其在表示信息14中越重要。至于用于挑选正文部17的步骤304,可以执行模式挑选以包括在信息14中所含有的最重要的模式。至于正文部17,可以在与信息大小和发现的模式的总数的关系中改变该模式阈值。通常,利用更小的文档来降低信息阈值,以增加对于找到论题可用的数据。认识到,可以动态地设置模式阈值以留下充分数量的正文部17来找到模式,并且因此,确定语境定义104、105。如果模式已经通过重要性处理但是与任何其他模式不相关,则退化情况是使模式为语境定义104、105。接下来的步骤308是用于计算另外称为论题的语境定义104,可以将语境定义定义为置于信息14的模式上的一个示例性语义拓扑,其中,可以将多个信息14(例如,多个文档)用于形成语义语境15、19。幸存步骤306的重要模式集合转到模式集群算法(在这种情况下为P⑶G)。输出为模式集群集。模式集群为通过其含有的正文部17并且可能通过其在信息14内的位置而在信息14中相关的模式。认识到,模式集群的一个实施例为在两个以上不同事件21中重复两个以上正文部17(例如,在多个不同句子中共同找到两个单词,因此,指出它们彼此具有某种关系)。还认识到,事件21中正文部17的相对定位/位置可以便于模式集群的识别,例如,主要(例如,总是)找到彼此相邻的两个单词,主要(例如,总是)在每段的第一句中或者在每页的第一段中或者在每节的标题中找到一个单词等。PCDG中原型模式为覆盖集群中所有模式的正文部17的集合。此外,在步骤308中将所有正文部17表示为整数的事实可能促进计算的计算性能。例如,步骤308可以使用模式中的元素(单词)连同其在事件21结构内的位置使模式群集(即,形成语境定义104、10 。这意味着共享单词/短语的模式可以在相同集群中结束。此外,一直出现在相同事件21中的低阶模式可以在相同集群中结束。例如,模式原型为在包括语境定义104、105的模式中的单词/短语集合。在一些情况下,其为在包括 /形成语境定义104、105的模式中的单词Wn的适当子集。因此,语境引擎100将确定的论题(例如,语境定义104)表示为模式集合(集群)。 引擎100保持用于与集群的原型模式一致的论题(集群)的单词/短语列表。至于模式和正文部17,可以基于在语境定义104单词(模式原型)内含有的正文部17的重要性和/或模式重要性来排列语境定义104、105的先后顺序。语境定义104、105的集合表示语义语境 15/信息14的语义论题内容。例如,与一个或者多个文档结合的语境定义104表示文档组的语义语境15。在接下来的步骤310中,由于将信息14连同统计计算的结果一起存储在存储器 210中(例如,相关数据库-MS SQL Server 2005),引擎100存储语境定义104 (和单词、通过语境定义104所表示的模式)。保持语境定义104的存储紧凑的一个特性为将用于正文部17的整数表示用在存储器210中,连同全局正文部统计表一起,还保存并且把保持正文部17与整数(或者其他值In)之间的映射的词典(例如,全局信息109)除外。因此,鉴于以上情况,使用分析规则103对于模式关系分析在语境内所包括的内容。在文本的情况下,在优选实施方式中,关联性(模式)使用句子作为事件21。在电子表格(或者数据型数据格式)的情况下,在记录或者单元为事件21的情况下,使用模式分析技术。将在信息14内所找到的模式用于使用模式集群和数据分组规则形成论题(即,语境定义104)。此外,可以将论题群集为超级论题以进一步总结在语义语境15内的数据。语义语境15可以包括文档参考、单词、模式、论题、超级论题,当通过内容分析器模块102分析新信息14的时候,保持/更新文档参考、单词、模式、论题、超级论题。例如,可以将标准 SQL数据库用于更新/维持语义语境15的语境定义104。对于语义语境15的所有语境定义104,SQL数据库可以为全局的;然而,可以分等级地组织所有信息以识别信息14与其相关的语义语境15(注解可以将相同的语境定义104用于定义多个信息14)。此外,内容分析器模块102模块经由分析器规则103创建在信息14中所识别的单词、模式、语义结构以及数据之间的知识网(即,独立语境定义104之间的互连)。可以按照任何数量的方法分等级访问该网并且在任何时候通过新关系覆盖该网。这意味着可以按照任何水平来组织和访问语义语境15内的信息。这包括论题(主题)、模式、关键词、段落、 句子、以及其他语言结构。实际上,这意味着可以基于其主题(论题)或根据信息14中的实际文本通过用户组织和/或访问主题。例如,用户可以点击提及特定论题(即,语境定义 104)的段落并且语境引擎100可以识别与该论题相关的其他信息14(例如,文档)的所有部分。例如,可以将任何材料、文档、或者部分文档用于创建语境15。在段落(其被看作小文档)的情况下,语境引擎100使用信息测度和模式以找到最重要的正文部17。可以将该信息用于构成新搜索以找到相关信息或者可以将该信息用于对照用户的现有语境15进行测试。认识到,可以将上述规则集103用于确定用于选择独立信息14(用于可能添加至用户信息14集合)的语境定义105和/或用于确定组合语境定义104(例如,来自语义语境15的语境定义104的现有集合的超级论题)。鉴于以上情况,可以作为还称作超级论题的概括语境定义104、105计算语境定义 104的概括版本,可以不考虑文档源(例如,用于多个文档的语境定义104、105的概要)将超级论题称作语境定义104、105的概括。在概括语境定义104、105的计算中,首先,获得用于语境定义104、105的“模式原型”的集群,然后基于重要性和相互信息(参见下文中的相互信息定义)混合对用于每个概括语境定义104、105的模式原型中的单词Wn排序。概括语境定义104、105为与包括概括语境定义104、105的所形成语境定义104、105的所有模式关联的新原型(例如,为了数据库的压缩性以16个单词入选)。以下为概括语境定义104、105的计算的实施方式。1)搜集语境定义104
a.载入用于语境15的所有语境定义104b.建立用于在所有语境定义104中所指定的所有单词Wn的WordStats对象,包括i.全局自信息(来自单词表-例如,词典109)ii.局部自信息=_log2(局部单词计数/总语境单词计数)

iii.重要性=全局自信息-局部自信息c.建立论题词典(语境定义104列表的列表)2)集群语境定义104a.创建用于每个语境定义104的语境定义104集群b.语境定义104集群的目标#=(语境定义104#)/(log2(语境定义104#)) +概括语境定义104的最小数(例如,1)c.通过对在每个语境定义104对之间类似单词的#计数来建立用于语境定义 104 (集群)的相似矩阵d.当语境定义104集群#>目标(并且存在不同但类似的对)i.找到最靠近/类似对并且将语境定义104结合至较大集群,然后从常规可用语境定义104的集合中去除添加的语境定义104ii.相似性测度当前使用“平均相似性”,例如,(在两种集群中的所有相似性的和)/ ((在集群O中的论题#) * (在集群1中的语境定义104#))e.把语境定义104集群提交给数据库3)生成概括语境定义104a.使用以下公式对在每个语境定义104集群中的多个(例如,16)最重要单词Wn 排序i.单词重要性=(全局自信息-局部自信息)*相互信息ii.单词频率=每个语境来自每个文档的一单个语境定义104(模式)的所有单词频率的总和iii.全局自信息=来自单词表的全局自信息iv.局部自信息=_l*log(单词频率/单词的#)/log(2)v.相互信息=log((a*t)/(C*b))/log(2);其中1. a =在含有单词的语境定义104集群中的语境定义104#2. b =在含有单词的语境15中的语境定义104#3. c =在语境定义104集群中的语境定义104#4. t =在语境15中的语境定义104#b.把所有的当前模式迁移到用于语境15的概括的语境定义104关联性c.去除用于语境15的所有当前概括的语境定义104d.对于每个语境定义104集群i.将概括的语境定义104提交给数据库ii.找到与关键词关联的所有模式(最多16个)iii.根据模式的语境权重对找到的所有模式排序1.语境权重=(log(语境中模式频率)/log(2))*(模式权重);其中,模式权重=在语境定义104集群的排序中所计算的所有单词的重要性的总和(参见a)e.剔除至每个概括语境定义104的模式的最大值#(例如,语境定义104集群)= (关键词5)+1f.将模式提交给概括语境定义104关联性g.从数据库中移除语境定义104集群鉴于以上情况,按照概率论和信息论,两个随机变量的相互信息、或者传送信息可以为测量两个变量的相互依赖性的量。当使用基数为2的对数时,相互信息的测度的最普通单位为位。形式上,可以将两个离散随机变量X和Y的相互信息定义为
权利要求
1.一种用于便于在通信网络上属于共享主题的多个用户的社交网络的协作方法,所述方法包括向协作服务器发送搜索语境以用于确定与类似主题关联的所述协作服务器的另一用户,所述搜索语境包括至少一个第一语境定义以使所述第一语境定义具有自属于所述用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词,所述第一多个信息彼此相关并且由所述搜索语境的所述第一语境定义来表示这种关系;以及接收与所述另一用户关联的匹配搜索语境的识别,以使所述匹配搜索语境含有被认为与所述第一语境定义匹配的至少一个第二语境定义,匹配的所述第二语境定义包括自属于与所述另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。
2.根据权利要求1所述的方法,进一步包括选自包括以下内容的组的步骤请求访问与所述另一用户关联的所述第二搜索信息集合;以及在所述网络上请求访问所述另一用户。
3.根据权利要求2所述的方法,其中,从包括电子文档;网页;电子文件;搜索请求参数;以及应用状态信息的组中选择所述第一多个信息和所述第二多个信息。
4.根据权利要求3所述的方法,进一步包括从与多个各个其他用户关联的多个接收到的匹配搜索语境的列表中选择所述匹配搜索语境,以使多个接收到的所述匹配搜索语境的每个与对应的搜索信息集合关联。
5.根据权利要求4所述的方法,其中,所述列表含有用于多个接收到的所述匹配搜索语境的每个的相对排序信息。
6.根据权利要求5所述的方法,其中,所述列表包括用于多个接收到的所述匹配搜索语境的每个的各自链接,所述各自链接用于在请求访问所述对应的搜索信息集合中使用。
7.根据权利要求6所述的方法,其中,将所述各自链接引导至所述对应搜索信息集合的一部分。
8.根据权利要求2所述的方法,其中,所述第一语境定义为所述第一搜索信息集合中的至少一些所述第一多个信息提供语义语境标签。
9.根据权利要求8所述的方法,其中,所述第二语境定义为所述第二搜索信息集合中的至少一些所述第二多个信息提供语义语境标签。
10.根据权利要求9所述的方法,其中,所述第一语境定义和所述第二语境定义包括代表所述对应的搜索信息集合的确定的单词模式。
11.根据权利要求4所述的方法,进一步包括通过所述第一搜索信息集合的所述信息内容来集合所述第二搜索信息集合的选择的信息内容。
12.根据权利要求11所述的方法,进一步包括通过分配给所述第一搜索信息集合的所述搜索内容的所述语境定义来集合与选择的所述信息内容相对应的选择的语境定义。
13.根据权利要求12所述的方法,进一步包括向所述协作服务器发送集合的所述搜索语境,以便在确定与由集合的所述搜索语境所代表的类似主题关联的所述协作服务器的另一用户中使用。
14.根据权利要求4所述的方法,进一步包括将安全属性分配给所述第一搜索信息集合的一部分,所述安全属性定义关于所述协作服务器的所述多个用户的所述部分的访问级别。
15.根据权利要求14所述的方法,其中,从包括对于所述多个用户的所有用户限制的访问;对于所述多个用户中所选择的用户限制的访问;对于所述多个用户的所有用户开放的访问;以及对于所述多个用户中所选择的用户开放的访问的组中选择所述安全属性。
16.根据权利要求14所述的方法,进一步包括在发送所述搜索语境以前,过滤所述搜索语境的所述内容,所述过滤基于分配的所述安全属性。
17.根据权利要求14所述的方法,进一步包括从所述另一用户接收对于所述第一搜索信息集合的请求并且作为响应发送所述第一搜索信息集合。
18.根据权利要求17所述的方法,进一步包括在发送至所述另一用户以前,过滤所述第一搜索信息集合的所述内容,所述过滤基于分配的所述安全属性。
19.根据权利要求4所述的方法,进一步包括从所述搜索语境去除用户识别数据,并且在发送所述搜索语境以前用别名数据代替去除的所述识别数据。
20.根据权利要求4所述的方法,进一步包括从所述第一搜索信息集合去除用户识别数据,并且在发送所述第一搜索信息集合以前用别名数据代替去除的所述识别数据。
21.根据权利要求1所述的方法,其中,所述第一语境定义是所述第一搜索语境中所包括的多个第一语境定义之一。
22.根据权利要求1所述的方法,其中,所述第二语境定义是属于与所述另一用户关联的所述第二搜索信息集合的多个第二语境定义之一。
23.一种用于在通信网络上便于属于共享主题的多个用户的社交网络的协作系统,所述系统包括语境模块,适用于向协作服务器发送搜索语境以用于确定与类似主题关联的所述协作服务器的另一用户,所述搜索语境包括第一语境定义,以使所述第一语境定义具有自属于所述用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词,所述第一多个信息彼此相关并且由所述搜索语境的所述第一语境定义表示这种关系;以及所述语境模块进一步适用于接收与所述另一用户关联的匹配搜索语境的识别,以使所述匹配搜索语境含有被认为与所述第一语境定义匹配的第二语境定义,匹配的所述第二语境定义包括自属于与所述另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。
24.根据权利要求23所述的系统,进一步包括通信模块,所述通信模块适用于请求访问与所述另一用户关联的所述第二搜索信息集合。
25.根据权利要求24所述的系统,其中,所述系统驻留在所述用户的计算机上并且所述计算机为所述协作服务器的客户端。
26.一种用于确定在第一搜索语境与第二搜索语境之间的匹配的协作系统,所述第一搜索语境包括第一语境定义,以使所述第一语境定义具有自属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词,所述第一多个信息彼此相关并且由所述第一搜索语境的所述第一语境定义来表示这种关系,并且所述第二搜索语境包括第二语境定义,以使所述第二语境定义具有自属于与所述用户不同的另一用户的第二搜索信息集合的第二多个信息中选择的一个或者多个单词,所述第二多个信息彼此相关并且由所述第二搜索语境的所述第二语境定义来表示这种关系,所述系统在通信网络上与所述用户和所述另一用户的装置通信,所述系统包括通信模块,适用于接收与所述用户关联的所述第一搜索语境和与所述另一用户关联的所述第二语境;比较模块,适用于将所述第一语境定义与所述第二语境定义进行比较以确定所述比较是否满足匹配阈值;以及所述通信模块进一步适用于如果满足所述匹配阈值,则向包括所述第二搜索语境的所述用户的所述装置提供代表所述比较的数据。
27.根据权利要求26所述的系统,其中,所述通信模块适用于收集来自与所述用户不同的多个用户的匹配搜索语境,然后通过基于所述比较指出在所述匹配搜索语境之间的相对排序将收集的所述匹配搜索语境提供给所述用户的所述装置。
28.根据权利要求1所述的方法,其中,接收到的所述搜索语境是基于用户请求或者与用户交互无关地、基于所述用户的协作引擎的请求。
29.根据权利要求28所述的方法,其中,所述第一语境定义是在所述第一搜索语境中所包括的多个第一搜索语境之一。
30.根据权利要求29所述的方法,其中,所述第二语境定义是属于与所述另一用户关联的所述第二搜索信息集合的多个第二语境定义之一。
31.根据权利要求30所述的方法,进一步包括如果确定比较的所述第二语境定义与至少一些所述第一语境定义匹配,则通过所述第一语境定义过滤所述第二语境定义。
32.根据权利要求31所述的方法,进一步包括通过所述第一语境定义过滤所述第二多个fe息。
33.根据权利要求32所述的方法,其中,从包括肯定;否定;以及在计算所述第一语境定义与所述第二语境定义之间的全局匹配中所使用的全局语境的组中选择所述语境定义。
34.根据权利要求28所述的方法,其中,从包括数据库查询;文档的结构化查询;以及网页查询的组中选择所述请求。
35.根据权利要求28所述的方法,其中,所述协作引擎的所述请求为基于所述用户的活动通过所述协作引擎所启动的预测性查询。
36.根据权利要求35所述的方法,其中,从包括以下内容的组中选择所述用户的所述活动当所述用户在所述参照系的所述搜索语境中时,但是在提交所述用户请求以前;当所述用户在所述参照系的所述搜索语境中时,但是在提交所述用户请求期间;以及当所述用户在所述参照系的所述搜索语境中时,但是在提交所述用户请求之后。
37.根据权利要求32所述的方法,其中,将来自所述搜索语境的语境定义提供给所述用户作为用于由所述用户进行选择的请求建议。
38.根据权利要求1所述的方法,其中,根据选择的时段过滤匹配的所述第二语境定义。
全文摘要
一种方法和系统,包括向协作服务器发送搜索语境以便在确定与类似主题关联的协作服务器的另一用户中使用,该搜索语境包括至少一个第一语境定义以使第一语境定义具有从属于用户的第一搜索信息集合的第一多个信息中选择的一个或者多个单词。第一多个信息彼此相关并且通过搜索语境的第一语境定义表示这种关系。该系统和方法还包括接收与另一用户关联的匹配搜索语境的识别以使匹配搜索语境含有被认为与第一语境定义匹配的至少一个第二语境定义。匹配的第二语境定义包括从属于与另一用户关联的第二搜索信息集合的第二多个信息中选择的一个或者多个单词。
文档编号H04L12/16GK102160329SQ200980133717
公开日2011年8月17日 申请日期2009年6月30日 优先权日2008年7月1日
发明者哈施·汉德尔瓦尔, 尼克·福西, 布鲁斯·斯坎兰, 斯蒂芬·巴克索 申请人:多斯维公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1