用于生成搜索引擎搜索结果的方法和系统的制作方法

文档序号:6570935阅读:212来源:国知局
专利名称:用于生成搜索引擎搜索结果的方法和系统的制作方法
技术领域
本发明涉及用于使得搜索引擎和可搜索的内容丰富的数据库在当前显示的搜索结果中并入并使用户注意到存储在用户的本地系统上的与当前搜索请求有关的先前已访问过的搜索结果的方法、系统和设备。
背景技术
因特网和内网两者都是实现对大量信息的交换和获取的公知通信手段。由经由运行在用户的本地系统(例如客户端计算机)上的Web(网络)浏览器访问服务器的用户在因特网和内网上交换和获取该信息。Web浏览器提供了用于获取和查看由因特网/内网服务器(下文中统称为“Web服务器”)提供的信息、应用和其他资源的图形用户接口(“GUI”)。
Web服务器一般使用超文本传输协议(“HTTP”)以网页的形式将Web内容发送给Web浏览器。HTTP是一种提供到网站或这些网站的网页的用户访问的应用协议,其具有各种格式,包括文本、图形、图像、声音和动态功能。使用超文本标记语言(HTML)来对每个网页进行格式化,HTML是结合HTTP而使用的标准页面描述语言。HTML使得可以以文本和图形来显示网页,并且实现了播放声音、动画和视频数据。一旦用户选择了特定的超文本链接,本地系统的Web浏览器就读取和解译与这些链接相关联的统一资源定位符(“URL”)。然后,浏览器在选定的URL处与Web服务器连接,并请求该选定链接的HTTP。作为返回,Web服务器以HTML格式将所请求的链接发送给运行在本地系统上的Web浏览器以便由浏览器解译,并且最终由用户查看该网页或网立。
在获取所显示的超文本链接的处理中,可能会指示Web服务器集中搜索和显示结果。这是通过用户将搜索查询输入到运行在Web服务器上的搜索引擎或可搜索数据库(下文中统称为“搜索引擎”)的搜索窗口中来完成的。搜索查询可以包括关键字和/或短语。搜索引擎浏览因特网或内网以对包含期望的关键字和/或短语的网页进行定位。然后,搜索引擎返回包含这些关键字和/或短语的网页的列表以供用户查看,其中已基于搜索引擎所使用的算法而对网页进行了排序。
然而,采用常规搜索引擎的问题是,搜索仅限于对因特网或内网上的网页文件或网站文件进行定位,并将这些网页或网站显示给用户。除了这一问题之外,一旦用户得到了这些搜索结果,如果用户期望在以后搜索相同主题或类似主题,则搜索引擎会显示一组新的结果,其可能包括或可能不包括在先前的搜索结果中已经定位的这些网页或网站。这是不期望的,原因是用户可能期望访问或再次访问在先前的搜索结果中列出的一些选定的网页或网站。
当用户使用与过去所使用的那些关键字或短语不同的关键字或短语来搜索先前已搜索过的主题时,以上问题变得甚至更加复杂。在这种情况下,搜索引擎通常返回包括大量新的网站和网页的搜索结果,使得用户必须在随后通过新列出的网站或网页执行冗长和耗费时间的浏览任务,以对期望的先前已访问过的感兴趣的网页或网站进行定位。此外,当向用户呈现新的搜索结果列表时,任何所存储的关于用户如何到达特定网站或网页的导航历史一般已丢失。
因此,将会有益的是提供一种方法、系统和设备,用于使得用户可以容易且迅速地访问包括用户先前在过去的会话期间访问过的文件(即网页或网站)的详细的搜索结果列表,以使得该用户能够对感兴趣的网站或网页进行定位。

发明内容
鉴于现有技术的问题和缺陷,本发明的一个目的是提供用于在搜索引擎显示中将联机和脱机搜索结果合并在一个单一的概览中的方法、系统和设备。
本发明的另一个目的是提供生成合并的联机和脱机搜索结果列表,使得用户能够容易和迅速地访问先前已访问过的感兴趣的文件的方法、系统和设备。
本发明的另一个目的是提供用于使得搜索引擎和可搜索的内容丰富的数据库在当前显示的搜索结果中并入并使用户注意到存储在用户的本地系统上的与当前搜索请求有关的先前已访问过的搜索结果的方法、系统和设备。
本发明的又一个目的是提供用于重构导航路径,使得用户可以沿循该用户先前所沿循的浏览或搜索路径的方法、系统和设备。
根据说明书,本发明的其他目的和优点将部分地变得明显并且将部分地显而易见。
在本发明中实现了以上目的和其他目的,其对本领域的普通技术人员来说是显而易见的,本发明针对一种用于生成搜索引擎搜索结果的方法。该方法包括提供搜索引擎并将搜索查询输入到该搜索引擎中。然后,使用搜索引擎来对与搜索查询有关的联机文件进行定位,并且对驻留在客户端计算机上的与搜索查询有关的脱机文件进行定位。然后,将已定位的联机文件与脱机文件合并以生成显示在搜索引擎显示中的单一的搜索结果概览。
在本发明的这一方面中,脱机文件是来自过去的会话的先前已排序的文件,其现在驻留在客户端计算机上。这使得本发明能够使用搜索引擎的评分算法来生成单一的搜索结果概览,其中对所呈现的搜索结果中的脱机文件以及联机文件进行排序。单一的搜索结果概览的脱机文件优选地在搜索引擎显示中引起用户的注意以向该用户表明这些脱机文件实际上驻留在用户的计算机上。
这一生成搜索引擎搜索结果的方法还可以包括使用唯一的标识符来标识客户端计算机处的用户,以及由搜索引擎利用该唯一标识符访问存储在客户端计算机上的该用户的个人文件。对与所输入的搜索查询有关的联机文件和脱机文件进行定位,以便生成所呈现的单一的搜索结果概览。这些搜索结果是使用搜索引擎的评分算法来生成的。
在对脱机文件进行定位的步骤中,首先确定搜索引擎是否愿意与客户端计算机共享评分算法。如果搜索引擎愿意共享评分算法,则确定客户端计算机是否能够执行评分算法。如果客户端计算机能够执行评分算法,则将评分算法下载到客户端计算机,使用这种评分算法来对脱机文件进行排序,然后将已排序的文件存储在客户端计算机上以供搜索引擎获取。运行在搜索引擎上的本发明组件使用这一信息来生成单一的搜索结果概览。
在客户端计算机不能执行评分算法的情况下,则必须确定脱机文件是否是从联机源获得的。如果脱机文件是从联机源获得的,则在联机源上对这些脱机文件的原始联机文件进行定位,并将到这些原始联机文件的链接存储在客户端计算机中以供搜索引擎获取。然而,如果该脱机文件并非来自联机源,则确定搜索引擎是否将接受来自客户端计算机的上传文件,并且如果搜索引擎将接受上传文件,则从客户端计算机向搜索引擎上传文件,使用评分算法来进行排序,并提供到这些已排序的上传文件的唯一链接并将其存储在客户端计算机上以供搜索引擎根据本发明而使用。
可以得到一种在搜索引擎不愿意共享评分算法时对脱机文件进行定位的替代性的方法。在本发明的这一方面,确定脱机文件是否是从联机源获得的。在脱机文件来自该联机源的情况下,对原始联机文件进行定位,由搜索引擎生成到这些原始联机文件的链接并将其存储在客户端计算机中,以便提供本发明的单一的搜索结果概览。
然而,如果脱机文件并非来自联机源,则必须确定搜索引擎是否将接受来自客户端计算机的上传文件。如果接受上传文件,则从客户端计算机向搜索引擎上传选定的文件,并使用搜索引擎评分算法来进行排序。在搜索引擎上生成到这些已排序的上传文件的唯一链接并将其存储在客户端计算机中以供搜索引擎在以后获取以便生成单一的搜索结果概览。
在生成搜索引擎搜索结果时,该方法还可以包括将单一的搜索结果概览发送给客户端计算机,确定搜索结果中的选定脱机文件在客户端计算机上是否仍然可用,并且如果脱机文件可用,则将这些所存储的先前已在过去的会话期间排序的脱机文件与搜索结果中的选定脱机文件进行匹配。然后,搜索引擎获取匹配脱机文件的过去路径信息以便重构先前所沿循的路径。将这一信息连同本发明的单一的搜索结果概览一起结合到搜索引擎显示中。
本发明还针对用于生成本发明的单一的搜索结果概览的系统和程序存储设备,该单一的搜索结果概览包括响应于搜索查询而进行定位并使用搜索引擎的评分算法进行排序的联机文件和脱机文件。


特别地在所附权利要求中阐明了确信为新颖的本发明特征以及本发明所特有的单元。附图仅用于说明的目的并且并非按比例绘制。然而,通过参考以下结合附图而进行的详细说明,可以最好地针对操作的组织和方法而理解本发明本身,其中图1A-图1B是本发明的用于提供合并的联机和脱机搜索结果的系统的示意图。
图2示出了本发明的用于提供合并的联机和脱机搜索结果的处理流程的流程图。
图3示出了用于从客户端计算机获得脱机文件以便包含在图2的合并的联机和脱机搜索结果中的处理流程的流程图。
图4示出了用于重构先前已访问过的文件的所沿循的过去的路径以便包含在图2的合并的联机和脱机搜索结果中的处理流程的流程图。
图5示出了选择选项,其可以显示在搜索搜索引擎窗口上以便采用本发明来提供合并的联机和脱机搜索结果。
具体实施例方式
在描述本发明的优选实施例时,将在此对附图的图1-图5进行参考,其中相似的标号表示本发明的相似特征。
当前的搜索引擎的问题是,它们不会将联机搜索结果与来自客户端计算机的脱机(即桌面)搜索结果合并。本发明通过提供用于将联机和脱机搜索结果合并在单一搜索引擎概览中以便显示给用户的方法、系统和程序产品而解决了这一问题。合并的单一概览搜索结果为请求搜索查询的用户提供了已排序的搜索结果,其包括位于因特网或内网上的联机文件以及存储在用户的计算机上的脱机个人文件。这有利地使得用户能够再次访问该用户先前已经在过去的浏览或搜索会话期间访问过的感兴趣的文件,诸如网页或网站。
参考图1A,本发明包括一种运行在客户端计算机上的系统,用于存储先前已访问过的文件,特别是先前已访问过的网页或网站,并用于与本发明的运行在搜索引擎上的用于生成本发明的合并的搜索结果的系统进行通信。在第一处理10中,用户在搜索引擎上打开会话,请求搜索查询,并且搜索引擎对与搜索查询相匹配的文件(即网页或网站)进行定位(步骤20)。用搜索引擎的评分算法根据搜索结果中的文件与所请求的搜索查询的相关度来对这些文件进行排序。一旦用户访问搜索结果中的文件,或一个接一个地浏览文件,就将标识每个被访问的文件的信息以及访问这些文件的页序或路径发送给客户端计算机(步骤30)以便存储到客户端计算机上的存储器中(步骤40),并且以便如下所述地根据本发明而进行后续使用。退出当前搜索会话(步骤50)。
如图1B所示,一旦用户决定在以后发起后续的搜索会话(步骤100),该用户就输入用于运行在搜索引擎上的另一个搜索查询(步骤110)。根据本发明,运行在搜索引擎上的系统随后与运行在客户端计算机上的系统进行通信(步骤120、130和140)以便访问存储在客户端计算机上的脱机个人文件,并且以便将这些脱机文件包括在本发明的搜索结果中(步骤150)。正如以下将进行进一步描述的,使用搜索引擎的评分算法在所呈现的合并的搜索结果中对这些先前已访问过的脱机文件进行排序,并且这些先前已访问过的脱机文件优选地在搜索结果中引起用户的注意。
例如,所呈现的合并的搜索结果可以包括1000个已排序的网页和网站的列表,而向用户高亮显示50个驻留在用户的客户端计算机上的这种已定位的相关的、已排序的文件。因此,本发明使得本发明的合并的搜索结果可以引用存储在用户的客户端计算机上的脱机个人文件。本发明的另一个优点是,由于存储在客户端计算机上的个人文件包括标识每个先前已访问过的文件的信息,以及访问这些文件的顺序或路径(步骤30),因此所呈现的合并的搜索结果包括使得用户可以重构先前在过去的浏览或搜索会话期间所沿循的路径或导航历史的特征。
另一个特征是,通常,如上所述,在用户使用与在过去的搜索中所使用的那些关键字不同的关键字来搜索先前已搜索过的主题时,来自那些过去的搜索的先前已访问过的文件存储在客户端计算机上的存储器中。一旦存储在其中,并且用户使用不同的关键字来搜索相同主题,本发明就使用已知的数据转换技术来对先前已访问过的与当前搜索查询有关的文件进行定位,这些数据转换技术包括但不限于数据挖掘、模式识别、分析、代码转换等。这样,应当意识到,本发明能够提供跨多个浏览器会话的合并的联机和脱机搜索结果。
为易于理解本发明,现在对图2-图4的流程图进行参考,这些流程图示出了本发明的方法步骤,其用于使得包括可搜索的内容丰富的数据库的搜索引擎能够将存储在用户的本地系统上的相关的先前已访问过的引用结合到当前的联机搜索结果中,以便为用户提供合并的联机和脱机搜索结果。优选地,驻留在用户的计算机上的搜索结果中的那些文件会引起用户的注意。尽管以下描述是本发明的优选处理流程,但应当意识到并理解,在不偏离用于提供合并的联机和脱机搜索结果的本发明的情况下,可以存在若干替代性方案、修改和变型。
在图2-图4的流程图中,圆圈中的标号标识去往和来自该流程图的其他部分的连接。对本发明的处理流程的流程图描述如下210识别用户。客户端计算机上的用户访问运行在因特网上或内网上的搜索引擎,并由唯一标识符进行标识以与其他搜索引擎用户相区分。例如,唯一标识符可以包括用户名和口令、用户的URL、用户的计算机上的cookie等。一旦识别出用户,处理流程就继续到步骤220。
220访问个人文件。在识别出用户后,在搜索引擎与用户的客户端计算机之间提供链接。由于用户的个人文件将不会直接包含在搜索引擎、因特网或内网中,因此该链接将使得搜索引擎可以访问驻留在用户的计算机上的个人文件。用户的个人文件可以包括但不限于先前已访问过并下载的网页、网站、文档等。处理流程来到步骤230。
230用户输入搜索查询。用户在搜索引擎的窗口中输入搜索查询,并且处理流程继续到步骤240。
240获得联机和脱机搜索结果。正是在此时,搜索引擎对与搜索查询相关的联机(即在因特网或内网上的)文件和驻留在用户的客户端计算机上的脱机文件进行定位。搜索引擎使用搜索引擎的评分算法来对相关的联机和脱机文件进行排序,并向用户呈现合并的搜索结果列表,其包括来自因特网或内网的联机文件和驻留在用户的计算机上的脱机文件。
在完成该提供合并的联机和脱机搜索结果的任务时,搜索引擎使用搜索查询关键字或短语在因特网或内网上搜索与所请求的搜索查询相关的联机文件(即网页或网站)。同时,使用相同的搜索查询关键字或短语,本发明搜索并获得来自用户的计算机的相关脱机文件以便根据本发明进行排序并包含在已排序的搜索结果中。以下将参考图3详细描述该获得脱机搜索结果的处理。
为一般地理解获得脱机搜索结果的处理,本发明首先确定搜索引擎是否愿意与客户端计算机共享其评分算法(步骤310)。如果搜索引擎愿意共享其评分算法,并且已经确定用户的客户端计算机具有足够的处理能力和容量(步骤315),则本发明将评分算法下载到客户端计算机。然后,使用搜索引擎评分算法针对相关度对驻留在客户端计算机上的个人文件进行排序(步骤320)。将这些已评分的脱机文件存储在客户端计算机上的存储器中以便上传到联机搜索引擎(步骤330)。
然而,如果搜索引擎不愿意共享其评分算法(步骤310),或者客户端计算机上没有足够的处理能力(步骤315),则确定个人脱机文件是否曾经联机(步骤340)。如果脱机文件是从在此统称为联机源(即WAN(广域网)或LAN(局域网))的因特网或内网获得的,则本发明将脱机文件与其原始联机文件进行匹配以便使用本发明的评分算法来对这些文件进行排序(步骤350)。然后,将到该匹配联机文件的链接存储在用户的计算机上的存储器中(步骤370)。
在脱机文件最初不是联机的情况下(步骤340),本发明确定搜索引擎是否将从客户端计算机接受上传的个人文件(步骤360)。如果接受上传文件,则将存储在客户端计算机上的个人文件上传给搜索引擎。然后,搜索引擎使用其评分算法来对这些上传的个人文件进行排序,生成到已排序的个人文件的链接,并删除上传文件本身(步骤365)。将到已排序的个人文件的链接连同唯一标识存储在客户端计算机上的存储器中(步骤370)。然而,如果搜索引擎不接受上传文件(步骤360),则确定是否要搜索更多的搜索引擎(步骤380),并且如果有更多的搜索引擎待搜索,则处理结束(步骤390)。如果没有更多的搜索引擎待搜索,则处理流程继续对联机文件进行定位和排序并将这些结果显示给用户。
然后,将来自步骤330的存储在客户端计算机上的本地存储器中的已排序的脱机文件以及来自步骤370的存储在客户端计算机中的到匹配联机文件的链接上传到联机搜索引擎以便生成合并的联机和脱机搜索结果列表。在这样做的过程中,以在此描述的方式,搜索引擎对因特网或内网上的与搜索查询相关的联机文件进行定位,并同时对来自用户的客户端计算机的与搜索查询相关的脱机个人文件进行定位。使用搜索引擎评分算法来对这些联机和脱机文件进行评分以便生成按照与所请求的搜索查询的相关度而排序的合并的联机和脱机搜索结果列表。
一旦生成了合并的联机和脱机搜索结果列表,处理流程就来到步骤250。
250发送搜索结果给本地浏览器。然后,将合并的联机和脱机搜索结果列表发送给用户的计算机。处理流程继续到步骤255。
255个人文件在本地系统上是否可用?然后,使用合并的搜索结果列表,本发明确定合并列表中的脱机文件(即驻留在客户端计算机上的那些文件)是否仍然驻留在该客户端计算机上。然后,对于合并列表中的每个脱机文件,运行在客户端计算机上的本发明的系统确定客户端计算机上的匹配文件在该客户端计算机上是否仍然可用。如果匹配文件在客户端计算机上不可用,则处理流程继续到步骤260。然而,如果匹配文件在客户端计算机上可用,则处理流程继续到步骤265。
260通知搜索引擎。在与合并的搜索结果列表中的那些脱机文件相匹配的文件不可用或不再可用的情况下,将关于这种不可用性的通知发送给搜索引擎。然后,搜索引擎将在生成显示给用户的其最终搜索结果时使用这一信息。处理流程继续到步骤280。
265将存储在本地系统中的文件与搜索查询进行匹配。如果匹配文件在客户端计算机上可用,则系统将存储在客户端计算机上的这些文件与合并的搜索结果列表中的脱机文件进行匹配。实质特征在于,先前已经使用在此所述的搜索引擎评分算法对来自客户端计算机的这些所存储的文件进行了评分或排序。继续到步骤270。
270获取针对已匹配文件的过去路径数据。一旦在客户端计算机上对匹配文件进行了定位,系统就获取与存储在客户端计算机上的这种匹配文件有关的过去路径信息。下面将结合图5来更详细地说明该获取用户所沿循的过去路径的处理。然后,将匹配文件和过去路径信息发送给搜索引擎以便进行进一步处理。处理流程继续到步骤280。
280呈现结果。搜索引擎获取不可用的匹配文件信息(来自步骤260)以及匹配文件和过去路径信息(来自步骤265-270),并使用这一信息来生成合并的搜索结果报告,其包括驻留在客户端计算机上的当前可用脱机文件以及与搜索查询相关的联机文件。如上所述,使用搜索查询评分算法根据这些合并的联机和脱机搜索结果与搜索查询的相关度来对这些结果进行排序。
在这样做的过程中,驻留在用户的客户端计算机上并且仅供客户端计算机处的用户使用的相关脱机文件优选地在搜索结果中引起用户的注意。这可以通过以下操作来完成,即在合并搜索结果的显示中对脱机文件进行高亮显示或颜色编码,将相关脱机文件显示在其自己的显示窗口中,在弹出窗口中,或向用户表明搜索结果中的选定文件直接驻留在用户的客户端计算机上的任意其他显示手段。在将本发明的合并的联机和脱机搜索结果呈现给用户时,运行在客户端计算机上的浏览器通过Java启动程序或甚至通过HTML来显示本发明的搜索结果。处理继续到步骤290。
290结束。一旦将合并的搜索结果报告显示给用户,处理流程就结束。然后,用户可以通过输入新的搜索查询来重新开始处理流程。
为更好地理解如何根据本发明获得脱机文件搜索结果,以下将描述图3的详细处理流程。一旦确定搜索引擎必须对驻留在客户端计算机上的脱机文件进行定位(步骤240),则处理流程如下310评分算法是否可用?运行在客户端计算机上的本发明的系统确定用户所登录的当前搜索引擎是否愿意与该系统共享其评分算法以便对存储在客户端计算机上的脱机文件进行排序。通过使用搜索引擎评分算法,基于存储在客户端计算机上的脱机文件与所请求的搜索查询的相关度来对其进行排序或评分。例如,可以基于所搜索的查询关键字在文件中的出现率从最高到最低对已定位的脱机文件进行排序。
如果搜索引擎允许于客户端计算机共享其评分算法,就下载该评分算法并将其存储在客户端计算机上以便对位于该客户端计算机上的脱机文件进行排序。一旦下载了评分算法,处理流程就继续到步骤315。然而,如果搜索引擎不允许共享其评分算法,则处理流程继续到步骤340。
315是否有足够的处理必要条件?如果联机搜索引擎愿意与客户端计算机共享其评分算法,则本发明的系统确定客户端计算机是否具有足够的处理能力和资源来实现和执行所下载的搜索引擎评分算法。例如,可以确定客户端计算机是否能够使用其当前资源在任意时间约束或在合理的时间量之内执行该评分算法。
如果客户端计算机能够执行所下载的评分算法,则处理流程继续到步骤320。作为替代,如果客户端计算机不具有足够的处理能力和资源来执行这种评分算法,则处理流程继续到步骤340。
320对本地文件进行评分。然后,该系统在用户的客户端计算机上搜索存储在客户端计算机上与搜索查询相关的文件,并使用所下载的搜索引擎评分算法来对这些已定位的脱机文件进行排序。来到步骤330。
330存储已评分的文件。然后,将已排序的脱机文件存储在例如DB1 335之类的驻留在用户的客户端计算机上的本地数据库中以便包括在步骤240的搜索结果中。继续到步骤240。
340是否发现文件联机?如果已经确定搜索引擎不允许共享其评分算法(步骤310),或者客户端计算机上没有足够的处理能力和资源来执行搜索引擎评分算法(步骤315),则本发明寻找一种对在用户的客户端计算机上的能量和/或资源消耗更少的替代性方法。在这一方法中,本发明使用联机文件与脱机文件之间的相似度来获得针对存储在客户端计算机上的脱机文件的相对评分。在这样做的过程中,本发明首先确定存储在客户端计算机上的文件是否曾经是联机源(即在因特网或内网上)。
例如,本发明可以分析本地文件以确定它们是否是网页或网站,或者是否是从因特网或内网或者任意其他可搜索数据库下载到客户端计算机上的。可以通过以下操作来获得这一信息,即本发明分析客户端计算机上的本地高速缓存,或分析文件本身。如果确定文件曾经是联机的,则处理流程继续到步骤350。然而,如果文件未联机过,则处理流程继续到步骤360。
350找到原始联机文件。如果本地脱机文件曾经联机,则使用搜索引擎对因特网或内网进行搜索以对当前联机的这种文件的原始文件进行定位。这使得能够使用搜索引擎的评分算法来获取对与用户的脱机文件相匹配的当前联机文件的相关度排序。一旦已定位,就生成到客户端计算机中的文件的该联机版本的引用或链接。然后,处理流程来到步骤370。
360搜索引擎是否允许上传文件?然而,如果确定存储在本地客户端计算机上的文件先前未联机过,则本发明确定搜索引擎是否将允许从用户的本地客户端计算机上传文件。在这样做的过程中,从客户端计算机向联机搜索引擎发送请求,请求该联机搜索引擎接受来自客户端计算机的上传文件,以便使用搜索引擎的评分算法根据与所请求的搜索查询的相关度来对这些文件进行分类和排序。然后,使得这些经分类和排序的文件仅对该用户可用,正如以下将结合步骤365所述。如果搜索引擎接受从客户端计算机上传文件,则处理继续到步骤365,并且如果搜索引擎不接受从客户端计算机上传文件,则处理来到步骤380。
365搜索引擎对文件进行处理。在搜索引擎将接受来自客户端计算机的上传的脱机文件并对其进行评分的情况下(步骤370),将来自用户的客户端计算机的选定文件上传到联机服务器。这些文件是基于位置(诸如“My Documents”(我的文档)之类的位置)、编辑历史(未编辑过的文件很有可能不是该用户自己准备的文档)和可选选择(基于该可选选择将文件选定为存档在备份存储解决方案上)来选择的。然后,运行在服务器上的搜索引擎使用搜索引擎的评分算法来对来自客户端计算机的上传文件进行分类以基于与所请求的搜索查询的相关度优选地从最高到最低对这些文件进行排序。
在使得已排序的个人文件仅对该用户可用时,搜索引擎生成到用户的计算机上的每个已排序的文件的位置的链接,并删除该上传的文件本身以节省搜索引擎上的存储空间。该链接唯一地标识了用户的计算机上的每个文件的位置和排序,并且对特定用户计算机来说是唯一的,以便使得该用户能够控制对位于该用户的计算机上的其个人文件的访问。在这样做的过程中,用户优选地通过口令与指令的结合来控制对其个人文件的访问,该指令是关于搜索引擎如何使得文件对该用户可用的。正是这些指令优选地包括了命令,该命令用于将该用户标识为有权访问用于访问该用户的计算机上的文件的唯一链接的唯一个人或实体。
然后,处理流程继续到步骤370。
370存储在存储器中。本发明存储来自步骤350的到用户的脱机文件的已排序的联机匹配文件的引用或链接,或者作为替代,其存储来自步骤365的到该用户的计算机上的每个已排序的文件的位置的引用或链接,以便使得仅有该用户能够访问该文件。在任一方法中,将每个引用或链接存储在客户端计算机的存储器中,诸如本地数据库335中,或者用户计算机上的不同数据库中。处理流程继续到步骤240。
380寻找更多的搜索引擎。如果在步骤360中搜索引擎不允许上传文件,则处理流程可以继续判断搜索查询是否将被输入到更多的搜索结果中。如果要在其他搜索引擎中搜索该搜索查询,则处理流程继续到步骤390。然而,如果不再在其他搜索引擎中搜索该搜索查询,则处理来到步骤240。
390结束。此时已经确定将利用其他搜索引擎来生成针对所请求的搜索查询的相关搜索结果。当前会话的处理流程结束,并且用户可以随后通过在另一个搜索引擎上发起新的搜索会话来重新进入本发明的处理流程。
关于获取过去的路径的步骤,该处理使得用户可以重构先前在过去的浏览或搜索会话期间所沿循的路径。实质特征在于,用户先前在这种过去的会话期间已访问过的文件现在连同相应的过去路径信息一起存储在用户的计算机上(步骤270)。在这样做的过程中,该处理有利地使得用户能够对该用户曾经在先前的搜索会话期间进行过定位的期望的网站进行定位。
应当理解,该获取过去的路径的步骤是可选的,并且可以在用户需要这种过去路径信息时由用户选择。在用户想要重构先前所沿循的路径的情况下,用户可以在搜索引擎窗口显示上选择过去路径选项。应当意识到,该过去路径选项可以自动地运行在本发明的系统上,以便当搜索引擎生成合并的联机和脱机搜索结果时,可以将该过去路径信息结合和嵌入在这些结果中。然后,用户只需要进行过去路径选项选择。
作为替代,过去路径选择选项可以由用户在搜索引擎生成本发明的合并的联机和脱机搜索结果之后选择。在这一方面,一旦将这些合并的搜索结果显示给用户,该用户就可以选择针对列在搜索引擎中的特定文件的过去路径信息,并且然后,搜索引擎将获取过去路径信息,正如在此所述。
在获取该过去路径信息时,无论其是在生成本发明的合并的搜索结果之前还是之后进行的,一旦已经在客户端计算机上对与搜索结果脱机文件相匹配的文件进行了定位(步骤270),就通过沿循如下处理流程来获得用户在他先前访问该匹配文件时所选取的路径410加载浏览器历史。一旦在客户端计算机上对匹配文件进行了定位,就将与该文件相关联的浏览器历史加载到存储在客户端计算机上的本地存储器中。处理继续到步骤420。
420加载“最近的文件”。同样将最近从客户端计算机的操作系统访问过的文件加载到存储在客户端计算机上的本地存储器中。处理来到步骤430。
430对于每个找到的搜索结果,找到出现率。然后,运行在客户端计算机上的本发明的系统确定存储到存储器中的浏览器历史或存储在存储器中的“最近的文件”中的每个已定位的匹配文件的出现率。
440用户是否想要选择“过去的路径”?此时,用户必须确定是否要获得与该用户针对特定文件(即网页或网站)而选取过的过去路径有关的信息。这可以通过由用户在用户的显示屏上选择“过去的路径,”选项来完成,以下将结合图5进行进一步的讨论。在用户不想要针对合并的搜索结果中的任何脱机文件的“过去路径”信息的情况下,处理流程继续到步骤280。然而,如果用户想要获取针对特定脱机文件的过去的路径,则该用户在显示屏上进行这种选择,并且处理流程继续到步骤450。
450选择“最近的文件”或浏览器历史。然后,本发明确定选定的“过去的路径”是否驻留在“最近的文件”中或驻留在位于客户端计算机上的浏览器历史中。如果“过去的路径”驻留在任一位置中,则对于用户期望过去路径信息的选定文件,本发明根据存储在客户端计算机上的信息确定用户紧接在期望的过去路径选择文件之前和之后访问了哪些文件。对所有识别出的之前和之后已访问过的文件重复这一处理,从而生成一条路径,该路径重构了该用户先前在过去的会话期间进行访问的步骤和文件。处理流程继续到步骤460。
460恢复和显示历史。将来自步骤450的已生成的过去路径信息发送给搜索引擎。搜索引擎在以下操作时使用这一信息生成合并的联机和脱机搜索结果(步骤270)以连同搜索结果一起显示期望其过去路径信息的选定文件,并向用户显示所重构的在客户端计算机先前访问该选定文件时用户所沿循的路径。期望其过去路径信息的选定文件优选地引起用户的注意,诸如通过高亮显示该文件来引起用户的注意。可以在搜索结果窗口中或在显示屏上的单独窗口中显示这一重构的路径。处理来到步骤270。
在发起本发明时,可以将搜索引擎显示实现为具有若干新的选择选项,作为显示中的不同的窗口或作为菜单选项,诸如图5中示出的那些。这些选择选项可以包括使得用户选择他是否希望存储在该用户的客户端计算机上的个人文件被搜索引擎访问和结合到本发明的所呈现的合并的联机和脱机搜索结果中的选项。例如,搜索引擎窗口可以包括用于由用户选择的“包括个人文件”选项510,以便使得可以在合并的联机和脱机搜索结果中结合并且可选地高亮显示该用户的个人文件。作为替代,用户可以选择“不发送文件给搜索引擎”选项520,其防止用户的个人文件被访问和结合到所呈现的搜索结果中。当机密文件驻留在客户端计算机上时,这一选项是期望的。
其他选项包括显示在搜索引擎窗口上的“保护我的联机文件”选项530、“包括过去的路径”选项540以及“包括文件细节”选项550。“保护我的联机文件”选项530使得用户能够通过“管理联机访问控制文件列表”532来控制和管理搜索引擎有权访问哪些个人文件,并通过“管理要选择的文件”534来区分对联机文件的访问控制。
当用户期望与在先前的会话期间所沿循的过去路径有关的信息时,该用户可以选择“包括过去的路径”选项540。如上所述,这一选项使得搜索引擎能够为用户提供先前已访问过的文件(即网站或网页)的历史或路径,使得该用户可以再次访问期望的文件。在这样做的过程中,可以将首选项设置为限制所生成的过去路径历史。例如,可以将搜索引擎显示实现为具有用户可以从中进行选择的另外的选项,诸如“提供路线长度”542、“将历史限制为搜索结果中的文件所属的URL域”544等。
用户还可以选择选取“包括文件细节”选项550。这一选项向搜索引擎表明文件细节必须包括在本发明的合并的搜索结果中。该“包括文件细节”选项使得用户能够选择该用户希望在合并的搜索结果中查看哪些文件细节(例如,文件名、创建日期、文件大小、最后修改日期、最后访问日期等),从而使得搜索引擎能够根据用户的首选项提供搜索结果。
本发明适合于结合联机搜索系统和本地搜索系统以及在浏览器技术中使用。应当意识到,可以将本发明的组件具体体现为存储在程序存储设备上的计算机程序产品。可以将这些程序存储设备设计为、制造为和用作利用光学元件、磁性元件和/或电子元件来执行本发明的特定方法步骤的机器的组件。这些程序存储设备可以包括但不限于诸如磁盘或计算机硬盘驱动器、磁带之类的磁介质,光盘,只读存储器(ROM),软盘,半导体芯片,等等。可以采用以已知源代码编写的计算机可读程序代码来对在此描述的特定方法步骤进行转换。
尽管已经结合特定优选实施例特别地描述了本发明,但显然,根据前述描述,本领域的普通技术人员将容易想到很多替代性方案、修改和变型。因此,可以考虑到,所附权利要求将涵盖在本发明的实际范围和本质内的任意这种替代性方案、修改和变型。
权利要求
1.一种用于生成搜索引擎搜索结果的方法,包括提供搜索引擎;将搜索查询输入到所述搜索引擎中;使用所述搜索引擎来对与所述搜索查询有关的联机文件进行定位;对驻留在客户端计算机上的与所述搜索查询有关的脱机文件进行定位;将所述联机文件与所述脱机文件合并以生成单一的搜索结果概览;以及在所述搜索引擎的显示中提供所述单一的搜索结果概览。
2.根据权利要求1所述的方法,其中所述脱机文件包括先前已排序的驻留在所述客户端计算机上的脱机文件,其中使用所述搜索引擎的评分算法对所述联机文件以及所述先前已排序的脱机文件进行排序,以生成所述单一的搜索结果概览。
3.根据权利要求1所述的方法,其中所述驻留在所述客户端计算机上的脱机文件包括来自先前的联机会话的先前已访问过的存储在所述客户端计算机上的联机文件。
4.根据权利要求1所述的方法,其中所述单一的搜索结果概览中的所述脱机文件引起用户注意,以便向所述用户表明所述脱机文件驻留在所述客户端计算机上。
5.根据权利要求1所述的方法,还包括步骤使用唯一的标识符来标识所述客户端计算机处的用户;由所述搜索引擎利用所述唯一标识符访问存储在所述客户端计算机上的所述脱机文件;对与所述输入的搜索查询有关的所述联机文件和所述脱机文件进行定位;以及使用所述搜索引擎的评分算法来生成具有所述联机文件以及所述脱机文件的所述单一的搜索结果概览。
6.根据权利要求5所述的方法,其中所述对所述脱机文件进行定位的步骤还包括确定所述搜索引擎是否愿意与所述客户端计算机共享所述评分算法。
7.根据权利要求6所述的方法,其中如果所述搜索引擎愿意共享所述评分算法,则确定所述客户端计算机是否能够执行所述评分算法。
8.根据权利要求7所述的方法,其中如果所述客户端计算机能够执行所述评分算法,则所述方法还包括步骤将所述评分算法下载到所述客户端计算机;使用所述所下载的评分算法根据与所述搜索查询的相关度来对所述客户端计算机上的所述脱机文件进行排序;将所述已排序的脱机文件存储在所述客户端计算机上;以及由所述搜索引擎获取所述已排序的脱机文件以便生成所述单一的搜索结果概览。
9.根据权利要求8所述的方法,其中如果所述客户端计算机不能执行所述评分算法,则确定所述脱机文件是否是从联机源获得的。
10.根据权利要求9所述的方法,其中如果所述脱机文件是从所述联机源获得的,则所述方法还包括步骤对所述联机源上的所述脱机文件的原始联机文件进行定位;将到所述原始联机文件的链接存储在所述客户端计算机中;由所述搜索引擎获取所述原始联机文件以便生成所述单一的搜索结果概览。
11.根据权利要求9所述的方法,其中如果所述脱机文件不是从所述联机源获得的,则确定所述搜索引擎是否将接受来自所述客户端计算机的上传文件。
12.根据权利要求11所述的方法,其中如果所述搜索引擎接受所述上传文件,则所述方法还包括步骤从所述客户端计算机向所述搜索引擎上传选定的文件;使用所述搜索引擎的所述评分算法根据与所述搜索查询的相关度来对所述选定文件进行排序;在所述搜索引擎上生成到所述已排序的选定文件的唯一链接;将所述唯一链接存储在所述客户端计算机中;以及由所述搜索引擎获取所述唯一链接以便生成所述单一的搜索结果概览。
13.根据权利要求6所述的方法,其中如果所述搜索引擎不愿意共享所述评分算法,则确定所述脱机文件是否是从联机源获得的。
14.根据权利要求13所述的方法,其中如果所述脱机文件是从所述联机源获得的,则所述方法还包括步骤对所述联机源上的所述脱机文件的原始联机文件进行定位;将到所述原始联机文件的链接存储在所述客户端计算机中;由所述搜索引擎获取所述原始联机文件以便生成所述单一的搜索结果概览。
15.根据权利要求13所述的方法,其中如果所述脱机文件不是从所述联机源获得的,则确定所述搜索引擎是否将接受来自所述客户端计算机的上传文件。
16.根据权利要求15所述的方法,其中如果所述搜索引擎接受所述上传文件,则所述方法还包括步骤从所述客户端计算机向所述搜索引擎上传选定的文件;使用所述搜索引擎的所述评分算法根据与所述搜索查询的相关度来对所述选定文件进行排序;在所述搜索引擎上生成到所述已排序的选定文件的唯一链接;将所述唯一链接存储在所述客户端计算机中;以及由所述搜索引擎获取所述唯一链接以便生成所述单一的搜索结果概览。
17.根据权利要求7所述的方法,还包括步骤将所述单一的搜索结果概览发送给所述客户端计算机;确定所述单一的搜索结果概览中的选定脱机文件当前在所述客户端计算机上是否可用;以及如果所述脱机文件可用,则将存储在所述客户端计算机上的先前已排序的脱机文件与来自所述单一的搜索结果概览的所述选定脱机文件进行匹配。
18.根据权利要求17所述的方法,还包括步骤获取所述匹配脱机文件的过去路径信息以便重构先前所沿循的路径;将所述过去路径信息发送给所述搜索引擎;以及生成所述单一的搜索结果概览并显示所述匹配脱机文件的所述过去路径信息。
19.一种用于生成搜索引擎搜索结果的系统,包括运行在客户端计算机上的第一组件,用于对先前已访问过的存储在所述客户端计算机上的与所请求的搜索查询有关的脱机文件进行定位;运行在搜索引擎上的第二组件,用于对与所述所请求的搜索查询有关的联机文件进行定位,并用于访问所述与所述所请求的搜索查询有关的已定位的脱机文件;运行在所述搜索引擎上的第三组件,用于将所述已定位的联机文件和脱机文件合并为单一的搜索结果概览,其中使用搜索引擎评分算法来对所述单一的搜索结果概览中的所述已定位的联机文件和脱机文件进行排序。
全文摘要
用于生成搜索引擎搜索结果的方法、系统和程序存储设备。由搜索引擎对与所请求的搜索查询有关的联机文件进行定位,同时使用相同的搜索查询来对先前已访问过的驻留在客户端计算机上的脱机文件进行定位。该搜索引擎从客户端计算机获取脱机文件并将这些脱机文件与已定位的联机文件合并在单一的搜索结果概览中。在该合并的搜索结果中文件的排列是使用搜索引擎评分算法根据与搜索查询的相关度来排序的,使得该合并的搜索结果中的脱机文件优选地引起用户的注意以表明这些文件驻留在客户端计算机上。
文档编号G06F17/30GK1996310SQ20071000150
公开日2007年7月11日 申请日期2007年1月4日 优先权日2006年1月6日
发明者蒂日斯·威尔布林克, 爱德华·E·凯利 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1