信息项检索的制作方法

文档序号:11288620阅读:277来源:国知局
信息项检索的制造方法与工艺

领域

本发明涉及信息项的检索,包括但不限于媒体项,诸如文字处理文档、出版物、学术文章、书籍、自生成媒体项、业务文档、娱乐文件、音乐或其他声音文件、电影或其他视频文件、包括网站的html文件以及基于网络的新闻项。感兴趣的信息项还可以包括数据项,诸如,电话号码、地址等。具体地,本发明公开了用于检索由搜索者不完善地并且联想式地回忆的信息项的改善的系统和方法。

背景

随着可用数据、以及各行各业的人们经历的浏览和访问的信息项的数量的爆炸性增加,日益需要这方面的改善:辅助人们在他们可能曾经查看过的或访问过的文档所在的地方的各种可能性中间找到他们先前查看过的或访问过的文档。特定的文档通常不再被储存在个人的个人计算机上,或者通常甚至也不再被储存在个人的云数据储存器上,它可能在没有复制的情况下已经在互联网上被查看或编辑。虽然关键字搜索日益强大,并且毫不费劲地搜索在互联网上的有索引的搜索数据库以及在人的计算机装备上自动更新的有索引的数据库,但通常情况下,人不记住特定的关键字,而是记住关于交互的其他方面。

在最近的改善搜索的尝试中已经有了一些认识,人们经常记住关于信息项的访问的关键字以外的方面,诸如,包括访问时间、访问频率、对信息项进行的动作(诸如,打印)、项的储存位置、或者项是否被编辑的其他元数据。例如,美国专利8,122,028和美国专利申请公布20090006475考虑索引元数据,诸如,在文档上花费的时间量、文档被查看的频率、以及与文档及其处理相关的其他用户度量。

发明人已经认识到,通过进一步扩展索引参数(包括与文档本身没有直接关系的参数),可以在搜索和检索方面更好地利用人类记忆的联想特征。有很多这样的示例:因为记忆与除了同时发生之外而没有其他关系的其他令人难忘的事件的间接关联,而使记忆很容易回忆-例如,记住jfk遇刺、或登月、或双子塔的破坏的大多数人可以在几年后生动地描绘了他们在事件发生时在哪里以及他们正在做什么。同样,很多人都有情景记忆,在情景记忆中,每当情景中的单个事件被回忆时,情景中的时间相关的事件都能被回忆起。例如,查看作为礼物而被给予的喜欢的花瓶可能会触发与花瓶或送礼者的实际呈现无关的花瓶被给予的那一天的回忆。这种记忆在现有的搜索引擎中是无用的,现有的搜索引擎始终将搜索规范用作被搜索的性质或内容的模板,并且仅返回与模板的性质或内容匹配或几乎匹配的信息项。

发明概述

根据本发明的第一广泛方面,提供了一种使用户能够标识用户或另一方先前已访问的一个或更多个信息项的方法,该方法包括下列步骤:

在计算机可读存储介质中,记录与由用户或另一方先前访问信息项同时发生的一个或更多个事件或计算机系统状态相关的并发属性;

接收来自用户的、寻求找到在先前访问的信息项中的一个信息项的搜索请求规范,搜索请求规范包括一个或更多个指定的并发属性,一个或更多个指定的并发属性包括除了同时发生之外与被寻找的先前访问的信息项无关的或者与对其的先前访问无关的至少一个不相关的并发属性;

访问所记录的并发属性,并向用户标识在先前访问的信息项中的、满足搜索请求规范的一个或更多个信息项。

在一个实施例中,所记录的并发属性被记录在每个并发属性的索引中,每个并发属性的索引标识在由用户先前访问的信息项中的哪些信息项先前与并发属性同时被访问,并且访问所记录的并发属性的步骤包括访问指定的并发属性的索引条目。

在一个实施例中,事件或计算机系统状态包括特定程序或文件是否被同时访问。

在一个实施例中,事件或计算机系统状态包括特定网站是否被同时访问。

在一个实施例中,事件或计算机系统状态包括新闻事件。

在一个实施例中,事件或计算机系统状态包括特定音乐项是否由用户播放。

在一个实施例中,指定的并发属性还包括与被寻找的先前访问的信息项相关的且作为被寻找的先前访问的信息项的属性的或者作为对被寻找的先前访问的信息项的先前访问的属性的其他属性。

在一个实施例中,其他属性包括与信息项的内容相关的属性。

在一个实施例中,信息项包括印刷出版项,并且与信息项的内容相关的属性包括以下中的一个或更多个:单词、短语、颜色、页数、图表数量、布局、标题、作者、出版年份和出版商。

在一个实施例中,其他属性包括与用户使用信息项执行的动作相关的属性。

在一个实施例中,与用户使用信息项执行的动作相关的属性包括下列中的一个或更多个:访问日期、当日访问时间、阅读花费的时间、查看次数、项是否被打印、项是否被注释、用户是否将文本从项复制到剪贴板、以及项是否被在线查看。

根据本发明的第二广泛方面,提供了一种用于使用户能够标识用户或另一方先前已访问的一个或更多个信息项的系统,该系统包括:

并发属性记录器,该并发属性记录器适用于在计算机可读存储介质中记录与由用户或另一方先前访问信息项同时发生的一个或更多个事件或计算机系统状态相关的并发属性;

请求接收器,该请求接收器适用于接收来自用户的、寻求找到在先前访问的信息项中的一个信息项的搜索请求规范,搜索请求规范包括一个或更多个指定的并发属性,一个或更多个指定的并发属性包括除了同时发生之外与被寻找的先前访问的信息项无关的或者与对该信息项的先前访问无关的至少一个不相关的并发属性;

搜索结果处理器,该搜索结果处理器适用于访问所记录的并发属性,并向用户标识在先前访问的信息项中的、满足搜索请求规范的那些信息项。

在一个实施例中,并发属性记录器将并发属性记录在每个并发属性的索引中,每个并发属性的索引标识在由用户先前访问的信息项中的哪些信息项先前与并发属性同时被访问,并且搜索结果处理器访问指定的并发属性的索引条目。

附图简述

图1是根据本发明的系统的实施例的具有搜索请求接收器的用户界面的屏幕截图;

图2是根据图1的实施例的并发属性记录器的系统部件的框图;

图3是根据本发明的实施例的方法步骤的框图。

实施例的详细描述

现在将描述本发明的实施例。

首先参考图1,示出了根据本发明的实施例的到达请求接收器程序的用户界面的屏幕截图10,其适用于从用户接收搜索请求规范。在屏幕的左侧是标题为“添加记忆”的按钮20,当用户使用指点设备(诸如,笔、鼠标或触摸)选择时,按钮20打开详述用于指定搜索请求的选项的气球(balloon)25。

将这些选项分为表示3种类型的栏30、40、50。标题为“关于文章,我记得:”的最左边的栏30列出了用户可以从中选择相关条件的信息项的属性。所列出的条件“单词或短语”在被选定时打开对话框,以指定用户可能记住或可能认为与文档主题相关的关键字或短语。所列出的条件“一些颜色”打开对话框,以指定用户可能记住的在信息项的布局中的一组颜色。类似地,其他条件用于指定页数、图表数量、文档是否为2栏布局、标题、作者、出版年份以及来源(期刊或出版商)。用户可以从栏30中选择并指定信息项的一个或更多个记得的或相关的属性,然后将其总结在屏幕左侧的区域60中。

标题为“与本文章进行交互,我记得:”的中间栏40列出了用户对信息项的先前访问的属性。选择第一条件“何时”为用户打开对话框,以提供用户回忆或猜测文件访问发生的日期或日期范围。选择所列出的条件“当日时间”为用户打开对话框,以指定用户可能记得或猜测信息项被访问的当日时间(上午、中午、下午、晚上)。与栏30一样,用户可以从栏40中选择和指定信息项的访问的一个或更多个记得的或相关的属性,然后将其作为搜索请求规范的额外条件添加在屏幕的左侧的区域60中。

说明本发明的关键特征,标题为“当时我还打开:”的最右边的栏50列出了与先前访问信息项同时发生的一个或更多个事件或计算机系统状态相关的属性,其在本实施例中全部涉及在信息项被访问(可选地访问特定文件)时在同一计算机上同时打开的一个或更多个程序的计算机系统状态。这些并发事件或计算机系统状态不是(如在栏30和栏40中的)被搜索的信息项的属性或对信息项的先前访问的属性,而是用户可能记住或猜测的关联事件或计算机系统状态。选择标题为“word文档”的第一条件可以打开对话框,如果需要的话,用户可以在对话框中指定他们记住或猜测的在同一时间被查看或编辑的特定word文档。如果没有指定特定的word文档,则搜索条件将包括同时打开的任意word文档。与栏30和栏40一样,用户可以从栏50中选择和指定一个或更多个记得的或相关的并发属性,然后将其作为搜索请求规范的额外条件添加在屏幕左侧的区域60中。

在本发明的其他实施例中,不相关的并发属性可以包括特定网站是否被同时地访问,或者正如在其中用户将新闻事件与对信息项的访问相关联的引言的示例中,可以包括并发的新闻主题,其可能通过使用关键字来指定。此外,不相关的并发属性可以包括用户是否正在播放特定音乐项。此外,不相关的并发属性可以涉及其他地方发生的并发事件,诸如,新闻事件或其他人的动作,但也可以是用户在与用户正在访问的计算机或设备不同的计算机或设备上发生的动作,而无论是在事件发生时还是在搜索时。例如,用户可以在第一设备上进行搜索,并且指定的不相关的并发属性是在第二设备(诸如,移动电话)上的电话呼叫,而对于信息项的搜索可能已经在第三设备(诸如,计算机或平板电脑)上被访问。

此外,不相关的并发属性可能关系到社交事件,诸如,推文或者其他人在推文中提及的事件。此外,不相关的并发属性可以涉及最低限度指定类型的事件。例如,用户可能回忆起在同一时间已经删除了文件,但是可能不记得是哪个文件,“最低限度指定类型的事件”是“删除某个文件”。

一旦用户完成了在区域60中总结的搜索请求规范(其可以包括使用除and之外的运算符将因子进行组合的布尔运算符),搜索结果处理器就解析搜索请求规范并访问包含相关记录的一个或更多个数据库。关于搜索请求规范中的与所寻找的信息项本身(栏30)的属性相关的部分(诸如,关键字),可以查阅常规的或现有的有索引的系统数据库,并且可以在搜索结果处理器内部产生满足栏30条件中的所有条件的信息项的临时列表。关于在栏40中的其他属性特别是在栏50中的通常没有索引的其他属性,可以查阅一个或更多个专用数据库以完成搜索请求的处理。取决于属性的性质,专用数据库已由如下描述的后台运行的程序、系统程序或应用加载项(add-ins)构成,而不必在同一设备上。对于在栏50中的并发属性,在本实施例中通过时间戳对专用数据库进行索引,并且每个数据库条目包括时间戳和当时正在运行的受监测的应用(诸如,微软word、excel等)的标识符,并且可选地还包括受监测的应用正在主动编辑的文件的标识符。一些专用数据库条目将会是在先前使用受监测的应用之一访问所寻找的信息项期间生成的条目。随后,搜索结果处理器能够匹配时间戳可以被认为是“并发的”(这意味着在阈值时间差内发生的)数据库条目,以最终向用户标识在先前访问的信息项中的满足所有搜索请求规范的一个或更多个信息项。阈值时间差大致为与用户系统相关的或与特定不相关并发属性相关的任何时间量,并且在此给出的示例中通常约为30分钟。在一些实施例中,阈值时间差可由用户选择作为在搜索期间的输入参数。

现在参考图2,提供了根据本实施例的并发属性记录器的系统部件的示意图。多个进程210-221独立地操作,以监测用户和计算机活动,并且周期性地(或在特定事件发生时立即)导致在专用数据库200中创建数据库条目。在当前的原型中,进程与中央进程或单独的进程进行通信,该中央进程或单独的进程进而创建数据库条目,但在其他实施例中,各个进程可以直接创建数据库条目。在编辑和查看程序(诸如,微软word、微软excel、adobeacrobat等类似程序)的情况下,在系统安装的时候安装应用加载项。每个应用加载项被编程为在每个记录间隔收集所需的信息,诸如,在应用中打开了哪些信息项,并且导致创建标识信息项、相关的应用和时间戳的数据库条目。通常,专用数据库200是有索引的数据库,并且数据库条目是例如使用sql或nosql语句创建的。

在某些属性(特别是在栏40中列出的属性中的一些属性)的情况下,信息可能只能由监测系统活动的驻留程序记录,诸如,例如,在栏40中的“我删除它”选项。本发明的系统的完整性和广度取决于协同工作的进程的数量,并且如本领域技术人员将认识到的,在不同的实施例中,这些进程可以以多种方式实现。

现在参考图3,提供了该系统的模块的综述。如上所述的由多个进程和应用加载项组成的并发属性记录器101在后台运行,并且能够写入专用数据库200。用户100与诸如在图1中描述的搜索请求接收器102进行接口通信,搜索请求接收器102使控制传递到搜索结果处理器103,搜索结果处理器103能够从专用数据库200以及可能的其它数据库读取,以处理搜索请求并且最终向用户100传递在先前访问的信息项中的满足搜索请求规范的那些信息项。

本发明的实施例可以包括一种设施,通过该设施查阅用户的日历,作为利用时间戳的对事件的实际记录。例如,不相关的并发属性可以是用户记得并发的特定餐厅处的晚餐。随后,该系统将会搜索用户的日历中与餐厅名称相关的条目,并搜索在并发阈值内的在日历中的时间和预定日期前后访问的信息项。

本发明提供了一种搜索和检索方法和系统,通过允许搜索规范包括不是信息文件或对信息文件的访问的、而是并发事件或计算机状态的属性,该搜索和检索方法和系统特别适用于人类记忆的联想性质。

本领域技术人员还应理解,在不脱离由最广泛的范围和权利要求确定的本发明的范围的情况下,可以对本发明进行许多变化。有许多已建立的自动索引文件以及提供计算机活动记录的方法,并且本发明不限于实现广泛目标的任何特定方法。

例如,虽然以上的示例涉及对关于信息项的并发事件或计算机系统状态进行即时(onthefly)记录和索引,但如上解释的,本发明的最广泛的方面扩展到这样的方法和系统:在该方法和系统中,通过将事件或计算机系统状态的记录时间与访问信息项的记录时间匹配,以后可以标识并发事件或计算机系统状态标识。另外,在一些实施例中,可以在不使用时间戳而是包括例如对于从先前事件开始的相对时间的测量结果的情况下记录并发性,或者在不记录绝对时间戳的情况下直接将属性分类为在事件的时间的并发。

此外,如本领域技术人员将认识到的,包括并发属性记录器、请求接收器和搜索结果处理器的本发明的处理元件和数据存储元件可以分布在物理位置中(诸如,在一个或更多个服务器上),或者更传统地可以直接位于用户设备中的计算机上。

此外,可以通过检查在用户设备或甚至网络网关级处的网络流量或数据包、监听整个网络的与一个或更多个设备相关的流量来检测事件。

此外,尽管使用本发明的大多数实例将会涉及搜索媒体文件,但是用户还可以搜索离散信息项,诸如,可能在媒体项(诸如,地址文件或电子邮件记录)内的电话号码或地址,因此,本发明的最广泛的方面涉及对广义上的信息项的检索。

除非符合条件,或者除上下文另有要求外,否则在权利要求中的术语“属性”扩展到包括以上给定示例的事件或计算机系统状态的任意特征或性质。术语“事件或计算机系统状态”扩展到对其他信息项(诸如,其他媒体文件)的并发访问,并且与这种其他信息项的并发访问相关的“属性”可以包括这种其他信息项的内容。

在以下的权利要求和本发明的前述描述中,除非由于明确的语言或必要的含义而上下文另有需要的情况,否则单词“包括(comprise)”或变型(诸如,“包括(comprises)”或“包括(comprising)”)是以包容性意义使用的,即,指定所陈述的特征的存在,但不排除在本发明的各个实施例中的另外的特征的存在或添加。此外,除非上下文需要,否则不必意欲在时间上按照所写的序列执行在权利要求书中列举的任何方法步骤,也不必意欲一旦开始就不进行暂停地执行在权利要求书中列举的任何方法步骤。

应当理解,如果在本文中提及任何现有技术的出版物,则这种引用并不构成对于该出版物在澳大利亚或任何其他国家中形成本领域公知常识的一部分的承认。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1