用于知识搜索的系统和方法

文档序号:6349191阅读:315来源:国知局
专利名称:用于知识搜索的系统和方法
技术领域
本申请涉及用于访问存储在基于计算机的数据库系统中的信息的自动知识搜索系统和方法。更具体地,本申请涉及信息网络的导航以及交互式知识搜索环境中的搜索思考过程的自动捕获。
背景技术
在信息技术的历史期间,已努力组织并理解不断增加的量的数据。虽然在关系数据库系统和商业智能系统的领域中已经进行了很多开发以帮助结构化数据的管理,但非结构化和异构数据管理的领域仍然是非常低效的。关键字搜索技术依然是主要的访问模型。 在语义技术中的最近进步产生了通过这样的搜索操作所检索的信息的精确性和相关性的提尚。然而,搜索的范例依然非常不适合于搜索者的需要。搜索者发出查询并接收结果, 但在很多情况下结果在数量上是巨大的,且必须在筛选结果时投入很多时间来找到特别重要的信息段。图1示出用于使用常规关键字搜索应用来检索查询结果的用户界面。具体地,在图1中,示出了 Google 搜索。关键字,S卩,“roller bearing (滚柱轴承)”被输入搜索框130中。当选择karch(搜索)按钮132时,返回“roller bearing”的结果134的列表。知识可视化技术被开发来帮助用户更好地理解结果集合的范围和内容。类似地, 面向本体的访问系统例(如语义web)试图通过导航分类学的揭露来向搜索者提供允许用户基于分类学术语来选择信息的子集的指导。图2示出用于数据可视化的用户界面,作为知识可视化工具的例子。具体地,在图2中,示出了Grokker 搜索。关键字,即,“roller bearing”被输入搜索框230中。当选择搜索按钮(“Grok”) 232时,针对“roller bearing” 返回的结果234显示在“Map View(地图视图)”中。这些常规导航系统具有从搜索者的意图分析中去除分类法的缺点。这会产生搜索者必须跨过的理解差距,以便有效地受益于所提出的信息观点。
常规搜索技术的另一关键缺点是它们的事务(transactional)性质。每次搜索是完全独立的事件,且在搜索时期中没有使事件关联的持久信息。该动作的独立性内在地与搜索者的意图不一致。搜索者常常不是为了发出单个查询的目的来使用搜索技术,而是为了通过一系列搜索请求钻研主题领域的目的来使用搜索技术,这些搜索请求通过搜索者的意图而关联。 当前的搜索和概念检索工具缺乏以有意义的方式维持这个联系的能力。作为结果,搜索工作人员必须特别记录并跟踪有关的搜索请求和其产生的结果集合之间的关系。这个过程非常冗长乏味,耗费时间,并且如果搜索者忽略捕获该过程的任何部分则遭受错误。

发明内容
根据本发明的各种方面,提供了用于提供自动知识搜索和映射能力的基于计算机的方法和系统。在一个实施例中,数据库知识搜索工具通过包括搜索位置变化识别能力和使用过滤能力的基于用户意图的结果而加强,使得当查询被提交时,它按照其与最近的查询的关系而被自动分类,并且查询结果基于搜索的领域被过滤并在框架中呈现给搜索者。在这个实施例中,用户与结果集合的交互也被识别为用户意图的指标。所提交的查询被处理为对一个或多个数据库的查询,并且自动提供对来自数据库的该查询的响应,响应根据如知识领域概念地图所定义的关键主题的分类而被过滤。特别过滤的响应被安排用于向用户进行呈现。可从查询关系分类和其它用户意图指标(例如子查询的发出或特定结果的选择和保存)自动产生用户搜索过程的机器表示。根据本发明的方面,不同的搜索领域将提议不同的用户概念地图和产生不同的结果表示模型。类似地,所提交的查询格式将优选地随着所应用的知识搜索技术而变化。例如,自然语言查询可用于使用语义算法的搜索引擎,而关键字查询可用于较不复杂的引擎。根据本发明的方面,存在可用于执行特定查询与先前查询的关系的分类的很多特定的技术,这样的技术可以包括从特定查询提取关键属性以创建查询简档(profile),以及比较该查询简档与先前查询的简档。根据本发明的一个方面,提供了知识搜索和映射的基于计算机的方法。该方法包括提供耦合到至少一个非瞬态存储介质的至少一个计算机处理器。所述至少一个计算机处理器被布置为执行一组处理任务,包括接收与搜索的领域有关的查询;将搜索知识地图中的查询存储在所述至少一个计算机存储介质中;将查询自动提交到一个或多个知识库; 将对查询的一个或多个响应过滤到响应关系子集中;以及使来自响应关系子集的响应的一个或多个关联到搜索知识地图中的所存储的查询。知识地图为搜索领域内的一个或多个查询提供相关的信息。该方法还包括使用包括实体-关系-实体三元组的实体-关系模型来产生搜索知识地图,包括将从所述一个或多个查询确定的主题表示为实体以及从信息分类法确定实体之间的关系。代表一个或多个查询的实体可以使其关联到对查询的一个或多个响应。响应关系子集可被分类为对查询的一个或多个响应的子组,所述子组通过信息分类法的公共关系与查询相关联。将查询提交到一个或多个知识库可以包括将该查询提交到知识搜索引擎以及将查询自动格式化为与知识搜索引擎相兼容。该方法可以包括将查询格式化为自然语言查询或关键字查询。知识搜索引擎可以包括语义索引和搜索工具,而所述一个或多个知识库可以包括语义分析知识库。知识库可包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。该方法还可以包括在与查询有关的搜索会话(session)期间记录用户交互以及将用户交互的机器表示存储在搜索知识地图中。根据本发明的另一方面,提供了知识搜索和映射系统。该系统包括耦合到至少一个非瞬态存储介质的至少一个计算机处理器。该系统还包括查询输入模块,其接收与搜索的领域有关的查询,将查询存储在搜索知识地图中,并将查询提交到一个或多个知识库。该系统还包括将对查询的一个或多个响应过滤到响应关系子集中的结果呈现器;以及使来自响应关系子集的一个或多个响应关联到搜索知识地图中所存储的查询的搜索事件记录器。知识地图为搜索领域内的一个或多个查询提供相关的信息。该至少一个处理器可以使用包括实体-关系-实体三元组的实体-关系模型来产生搜索知识地图,使得从一个或多个查询确定的主题被表示为实体,并且根据信息分类法来确定实体之间的关系。表示一个或多个查询的实体可以使其关联到对查询的一个或多个响应。响应关系子集可以被分类为对查询的一个或多个响应的子组,所述子组通过信息分类法的公共关系与查询相关联。查询输入模块可以将查询提交到知识搜索引擎并且将查询自动格式化为与知识搜索引擎相兼容。查询可以被格式化为自然语言查询或关键字查询。知识搜索引擎可以包括语义索引和搜索工具,而一个或多个知识库可以包括语义分析知识库。知识库可包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。搜索事件记录器可以记录与查询有关的搜索会话期间的用户交互,并且将用户交互的机器表示存储在搜索知识地图中。根据本发明的另一方面,提供了具有存储在至少一个非瞬态存储介质中的计算机可执行指令的计算机程序产品,所述指令在由至少一个处理器执行时执行知识搜索和映射的方法。该方法包括提供耦合到至少一个非瞬态存储介质中的至少一个计算机处理器。所述至少一个计算机处理器接收与搜索的领域有关的查询;将搜索知识地图中的查询存储在所述至少一个计算机存储介质中;将查询自动提交到一个或多个知识库;将对查询的一个或多个响应过滤到响应关系子集中;以及使来自响应关系子集的响应的一个或多个关联到搜索知识地图中所存储的查询。知识地图为搜索领域内的一个或多个查询提供相关的信肩、ο
该方法还可以包括使用包括实体-关系-实体三元组的实体-关系模型来产生搜索知识地图,包括将从一个或多个查询确定的主题表示为实体,以及根据信息分类法确定实体之间的关系。


考虑到附图和附随的详细描述,本发明将变得更加显而易见。本文中以例子的方式而非限制的方式来提供所描述的实施例,其中相似的参考标号指代相同或相似的元件。 附图未必按照比例,相反着重于说明本发明的方面。图1示出根据现有技术的用于检索查询结果的用户界面的实施例。图2示出根据现有技术的用于数据可视化的用户界面的实施例。图3是根据本发明的方面的在知识搜索和映射系统中的一组功能模块或处理器的实施例的高级架构图,这些功能模块或处理器可以在一个或多个计算机中实现。图4A是示出根据本发明的方面的图3的系统的架构图。图4B是示出根据本发明的方面的图3和图4A的系统所执行的处理的流程图。图5是根据本发明的方面的知识领域概念地图。图6示出根据本发明的方面的用于将已经根据搜索的领域过滤过的搜索结果呈现给搜索者的用户界面的实施例。图7示出根据本发明的方面的用于根据搜索者动作的捕获来呈现搜索知识地图的用户界面的实施例。图8是根据本发明的方面的可以用于执行本文描述的方法的计算机实现的架构图的实施例。图9是计算设备的网络的实施例,在这些计算设备中可以实现本发明。
具体实施例方式在下文中,将通过参考附图解释根据其的说明性实施例来描述本发明的方面。虽然描述了这些实施例,但为了简明起见通常省略公知的项目、功能或配置的详细描述。将理解,虽然术语“第一”、“第二”等在本文可以用于描述各种元件,但是这些元件不应被这些术语所限制。这些术语用于将一个元件与另一元件区分开,但不是暗示元件的所需顺序。例如,第一元件可以称为第二元件,并且类似地,第二元件可以称为第一元件,而不偏离本发明的范围。如本文使用的,术语“和/或”包括相关的列出项目的一个或多个的任何和全部组合。应理解,当元件被表示为在另一元件“上”或“连接”或“耦合”到另一元件时,它可以直接在另一元件上或连接或耦合到另一元件,或中间元件可能存在。相反,当元件被提到 “直接,,在另一元件“上”或“直接连接,,或“直接耦合,,到另一元件时,没有中间元件存在。 应以相似的方式解释用于描述元件之间的关系的其它词(例如,“在...之间”相对于“直接在...之间”、“相邻,,相对于“直接相邻”等)。本文使用的术语仅是为了描述特定实施例的目的,而不是用来限制本发明。如本文使用的,单数形式“a”、“an”和“the”被认为为也包括复数形式,除非上下文明确地另外指示。将进一步理解,当在本文中使用术语“包括(comprises)”、“包括(comprising) ”、“包括(includes) ”和/或“包括(including) ”时,指定所陈述的特征、步骤、操作、元件和/或部件的存在,但不排除一个或多个其它特征、步骤、操作、元件、部件和/或其组合的存在或附加。本发明的实施例通过提供容易地理解用户的搜索的上下文并且捕获用户所执行的搜索步骤的过程的能力来增强各种知识搜索工具的使用。这种增强由例如查看用户搜索的所关注的高级主题和在那些主题之间存在的概念关系的可视化的能力来提供。图3示出根据本发明的方面的知识搜索和映射系统10的实施例的高级架构图。知识搜索和映射系统10可以在一个或多个计算机中实现或由一个或多个计算机实现。在本实施例中,系统10可以包括共同实现系统功能的一组功能模块或处理器。在本实施例中, 这些功能模块或处理器包括查询输入模块20,例如用于提交和接收查询的界面;至少一个知识搜索引擎30 ;—个或多个可搜索的数据库40 ;搜索事件记录器50,其识别并且存储用户交互数据;结果呈现器60,其过滤查询结果并且以衍生自搜索领域的结构呈现查询结果;知识搜索地图70,其包括用户交互数据和所存储的选定查询结果的机器表示;以及搜索报告器80,其产生用户可用的存储在知识搜索地图70中的信息。系统10可使用一个或多个适当配置的计算机来实现,所述计算机例如包括一个或多个计算机处理器和数据存储设备以及输入和输出机构或设备,如上所述。下文描述的图8和9在高级别处描绘了计算机,并且可以使用一个或多个这样的计算机来实现系统10。在一个示例性实施例中,查询输入模块20可以提供交互查询输入表单或区以用于由用户例如经由计算机显示屏来进行查询提交。在另一示例性实施例中,可提供编程界面以允许源自于其它自动系统的查询提交。查询输入模块20向知识搜索引擎30和搜索事件记录器50提供所接收的查询以用于处理。知识搜索引擎30处理查询且并从可搜索的数据库40检索结果集合。可搜索的数据库40包括从其中检索结果的信息的机器可读存储库, 并且其可以布置在一起或彼此远离。搜索事件记录器50分析查询以确定其在用户的搜索会话中的重要性和在知识搜索地图70中的适当的表示形式。搜索事件记录器50还将该信息记录在知识搜索地图70 中。结果呈现器60过滤来自知识搜索引擎30的结果集合以根据搜索问题的搜索领域分类法来给结果分类,并将所选择的结果信息记录在知识搜索地图70中。知识搜索地图70还包括由搜索事件记录器50识别的用户交互的机器表示和由结果呈现器60存储的结果以及在这些交互和所存储的结果之间的关系。搜索报告器80将来自知识搜索地图70的交互、 所存储的结果和关系信息转换成对用户可读和有用的形式,其可以经由例如计算机屏幕的输出设备来进行呈现。图4A是图3的知识搜索和映射系统10以及可被包括在其中的子模块的实施例。 图4B示出说明可以由图4A所示的系统10执行的方法的实施例的流程图。如在计算机领域中的技术人将认识到的,图4A的架构代表一组功能模块,其可以使用至少一个适当配置的计算机(例如图8所示的计算机)来执行4B的方法。在一些实施例中,图4A中的每个功能模块体现在存储器中存储的计算机代码中,该计算机代码由至少一个计算机处理器执行以执行图4B的方法。参考图3、4A和4B,在处理步骤“接收查询”S21,输入查询由查询输入模块20的输入处理器21接收。S21的所接收的查询在两个操作序列中被处理,其中,可以连续或并行地进行这两个操作序列。处理步骤S21的所接收的查询被提供给查询输入模块20的查询搜索处理器22,其在处理步骤S22中向知识搜索引擎30发出查询。知识搜索引擎30搜索至少一个数据库40 (例如语义索引数据库)来找到与查询有关的信息以创建一组结果。在这个实施例中,知识搜索引擎30的结果提取器32在处理步骤S32中从数据库40获得所发出的查询的结果。结果呈现器60的过滤器62在处理步骤S62中按照领域来过滤结果并将所获得的结果再整理成所分类的结果的集合。可以根据所接收的查询和也许在当前搜索会话中的更早的处理的查询或用户动作的分析(例如语义分析)来确定领域。结果呈现器60的过滤结果呈现器64在处理步骤S64中呈现过滤的结果。过滤结果呈现器64将分类的结果传递给用户,并为用户提供交互式模型以识别所关注的特定结果。例如,所发出的查询的分类结果(包括交互式模型)可以经由计算机显示器以图形或文本格式被自动提供给用户,例如见图6-7。结果呈现器60的结果捕获器66在处理步骤S66中以机器可读形式存储所关注的结果。具体地,结果捕获器66在知识搜索地图70中捕获所关注的结果。结果的关注层次或所关注的结果可以根据用户与分类结果集合的交互来确定,例如,更多或更长的交互能够意味着更高的关注。此外,处理步骤S21的所接收的查询也被提供到搜索事件记录器50的查询分析器 (profiler) 52。查询分析器52在处理步骤S52中分析查询以识别查询的关键元素,并产生查询简档。可以通过例如查询的语义分析(例如,查询的主语、动作和宾语是什么)来确定查询的关键元素。查询简档是包括关键元素的查询的表示。搜索事件记录器50的查询关系计算器M在处理步骤SM中比较所分析的查询与以前处理的查询的关键元素,以确定所分析的查询与以前处理的查询的关系。存在可用于执行特定查询与先前查询的关系的分类的很多特定的技术,这样的技术可以包括在处理步骤S52中从特定的查询提取关键元素以创建查询简档以及在处理步骤SM中比较该查询简档与先前查询的简档的步骤。搜索事件记录器50的查询捕获器56在处理步骤S56中以机器可读的形式记录所分析的查询以及其与先前查询的关系。在处理步骤S70中,从所记录的查询、查询关系信息和所关注的结果的机器可读形式对其进行组合以创建所产生的知识搜索地图70。然后知识搜索地图70可以例如经由计算机显示器以图形或文本形式被自动提供给用户。关于图4A和4B描述的处理都可以响应于所接收的查询由计算机自动地完成。如上所表示的,知识搜索引擎30用于从数据库提取信息。知识搜索引擎30包括一个或多个知识搜索工具。知识搜索工具(通常也称为搜索引擎或数据库查询工具)便于对存储在基于计算机的数据库系统中的信息的有效访问。当可应用时,知识搜索工具和通过其搜索的数据库在本文被定义为“知识库”。用户能够通过以适当的形式(例如自然语言或布尔表达式)将适当构造的查询提供到知识搜索工具来定位相关的信息,其中,所述知识搜索工具搜索数据库并获得结果。知识搜索工具通过构造结果集合来对所输入的查询作出响应,该结果集合包括满足知识搜索工具所施加的关联标准的信息列表。这样的知识搜索工具的例子是由马萨诸塞州、波士顿的^wention Machine公司出售的称为 Goldfire htelligence 的基于计算机的系统。在通过引用将其内容并入本文的美国专利号6,167,370中部分地描述了在该工具中所使用的技术。为了执行知识搜索的目的,本文所述的实施例利用在美国专利号6,167,370中描述的语义索引和搜索技术。然而,在替代实施例中,可使用其它知识搜索工具。查询输入模块20向知识搜索引擎30提供查询,以用于从数据库提取信息。在一个实施例中,用户通过交互式接口(例如键盘、鼠标和显示器或屏幕)将查询提供到查询输入模块20。在另一实施例中,软件应用通过使用编程接口来向查询输入模块20提供查询。从数据库提取的结果由结果呈现器60处理。结果呈现器60基于在结果和查询之间的概念关系的分类来过滤每个结果,其中该结果是对该查询的响应。概念关系是搜索会话的搜索领域的衍生物,其可以被表示为如在图5中的概念地图。搜索领域是根据本发明的方面的用户在使用应用或系统时可以从事的知识领域的分类。其它搜索领域可表示主题区域,例如旅行、购物、娱乐和媒体、运动、社会网络或任何其它各种一般或专门的兴趣。也就是说,本发明并不内在地限于任何特定的搜索领域。图5是根据本发明的方面的知识领域概念地图500的实施例。在图5中,概念地图表示旅行的搜索领域。概念地图识别旅行搜索者所关注的实体,如在一个或多个搜索会话期间指示的。例如,目的地502、吸引物504、价格506、旅行社508、电话509、工作时间510、 地址511、食物512、旅馆513、旅馆规模514、描述515、推荐书516、气候518、签证520和旅行类型522是所识别的实体。连接这些实体的箭头(例如箭头1-19、23-四和31)表示在实体之间的所关注的关系或关联。在图5中,作为例子,箭头8指示实体“目的地”502和实体“吸引物” 504之间的关系。该关系是可能对旅行领域的搜索者有用的关系,因为它与例如能够回答“Anaheim的吸引物是什么? ”或“迪斯尼在哪里? ”等形式的问题的信息有关。在本实施例中,图3的结果呈现器60使用元数据标记来识别与查询的结果相关联的一个或多个搜索领域关系。这样的元数据分组允许查询结果的有效子分组。所产生的子组由于其在搜索领域中的内在相关性而对用户是有意义的。本示例性实施例使用语义技术来产生结果元数据标记;然而,其它元数据标记技术可用于将结果数据与搜索领域关系相关联。这种其它元数据标记方法包括在本领域中已知的那些技术,所以在本文不详细讨论。针对工程设备属性搜索领域描述图6和7。图6示出在产品制造应用和领域实施例中根据本发明的方面的可以由知识搜索和映射系统10产生的用户界面显示屏600的实施例。用户界面600的该实施例向搜索者呈现已经根据搜索领域(即,工程设备属性搜索领域)过滤的搜索结果。在图6中,术语“Battery system(电池系统)”被输入搜索区622中,且按钮 “Find(寻找)”6M被选择。这个动作引起过滤结果集合的呈现,过滤结果集合识别与工程设备属性领域相关的一些关系分类,即,例如Definitions (定义)601、Advantages (优 )602、Applications (应 M )603> More Specific ( M 胃 # )604、 disadvantages (
点)606、More General (更一般)612、Similarities (相似性)614、Locations (位置)618 和Differences (差异)620。框608和616表示与领域相关的其它关系分类。可替换地,可以使用更少、更多或不同的关系分类。在每个关系分类的标题旁边,一个数字出现在圆括号中。该数字指示在该关系分类中的结果的数量,这些结果也在每个框中的标题下面列出。例如,在Definitions 601 中,有15个结果,其被列在“Definitions (15) ”之下。在每个结果旁边也是圆括号中的数字。这个数字指示针对给定的结果找到的条目或响应的数量。例如,在Definitions 601中,数字“⑴”出现在“part of integrated circuit (集成电路的零件)”的左侧,这指示只有一个与“part of integrated circuit”结果相关的响应。再次参考图3,搜索事件记录器50识别并且存储用户交互数据,这种用户交互数据可以包括每个查询及其与搜索会话中先前查询的关系。这些数据存储在知识搜索地图70 中。所产生的知识搜索地图70包括由实体-关系-实体三元组构成的实体-关系模型,使得实体代表查询主题,而关系代表在信息分类法中的关系,其中查询是通过该信息分类法产生的。在图7的例子中,关系“Part of (零件)”是工程设备属性搜索领域的信息分类法的成员。可以通过对用户交互方法特定的不同方法来产生知识搜索地图70的实体之间的关系的识别。在一个实施例中,基于来自当前查询的选择的结果提交新的查询,将产生由所选择的结果所属的过滤结果集合子组的关系类别指定的当前查询和新查询之间的关系。再次参考图6,按钮611是查询提交按钮。当按钮611被选择时,相关结果“Elimination of need for daily charging batteries (对日常充电电池的需要的消除” 610作为新的查询被提交。因为这个结果选自过滤结果集合“Advantages”602,所以在这两个查询之间建立"Advantages,,的关系。也就是说,石角认"Elimination of need for daily charging lotteries”是某些“Battery system”的可能优点,也见图7。可使用其它显式动作解释方法来建立查询关系。在另一实施例中,分析直接提交的查询,并且在算法上计算其与先前查询的关系。 在图6中,框622是用户可编辑的区,用户可以在其中直接输入新的查询。当Find按钮624 被选择时,用户的查询被查询输入模块20识别,并且被提供到搜索事件记录器50,见图3。 产生包括查询属性的查询简档。新的查询简档可以与一个或多个先前查询简档进行比较以确定新查询与该一个或多个先前查询中的每一个的关系。可能确定,新查询是先前查询的改述,新查询通过来自搜索领域的关系概念而指向与当前查询有关的新主题,或新查询与该一个或多个先前查询的任何一个完全无关。可以从一个或多个先前查询选择最适合的查询。搜索事件记录器50将作为最适合查询的改述的查询关联到知识搜索地图70中的最适合查询实体。搜索事件记录器50识别与最适合查询有关的新主题作为用于包括在知识搜索地图70中的新元素,并且产生新的实体-关系-实体三元组以捕获最适合查询实体和新查询实体之间的关联。在本示例性实施例中,搜索事件记录器50将识别不相关的查询,但将不使这些新查询关联到其它实体。可以通过不同的机制来实现将新查询分类为改述的、相关的或无关的。在使用语义技术的实施例中,自然语言查询的主语、动作和宾语属性可以被提取和比较。基于自然语言表达的主语-动作-宾语结构中的变化,可以计算查询中的变化的程度,并且该差异测量可以用于将新查询指定为分类之一。计算查询差异的替代方法可以用于确定查询关系分类。词本体论、同义词词典和相似词关系信息可以用于识别改述。如上所述,用户可以选择特定的查询结果来识别具有特殊意义的选择结果。当通过与结果呈现器60 (例如通过显示器)的交互来进行这样的结果选择时,将所指定的结果关联到知识搜索地图70中的活跃的查询实体。
可以响应于查询而访问各种类型的知识库,并且这些知识库可以存在于不同的地方。例如,图6示出“karch in(在...中搜索)”下拉菜单626,其可以用于选择用于搜索的特定知识库,或如所示的能够搜索“Allknowledge bases (所有知识库)”。一组知识库可以包含在可以在用户位置处访问的用户自己的计算机存储器或诸如CD的便携式存储设备中。另一组知识库称为企业知识库,其一般在可由组织(例如公司)内的用户驻留或私有访问的一个或多个服务器上。另一组知识库是可公开访问的搜索引擎和数据库,例如 Google (搜索引擎)以及美国专利及商标局专利收藏(可搜索的数据库)。图7示出根据本发明的方面的由知识搜索和映射系统10针对工程设备属性搜索领域产生的用户界面屏幕700的实施例。用户界面屏幕700可以用于基于搜索者(用户) 动作的捕获来产生搜索知识地图770。图7示出可以如何呈现知识搜索地图770以用于由用户经由搜索报告器80进行观看,见图3。其它实施例可以使用呈现知识搜索地图770以用于观看的其它基于图形或文本的方法。图形元素701、702、703、704表示具有在搜索会话期间的搜索活动的地点的查询主题或实体。特别地,图形元素701表示“Power Switch (功率开关);”,图形元素702表 7]\ "Battery system ; ΜΜτ Μ 703 "Elimination of need for daily charging batteries ;”的优点,图形元素704表示“Hybrid vehicle (混合设备)”。连接线711、712、 713表示查询实体之间的关系。每个连接线具有与其相关的方向性的意义,该方向性由在每个连接线的一端处的箭头指示。这些连接线通知用户其搜索活动的历史和意图。例如,在图形元素701和702之间的连接线711指示用户已经检查了“Power Switch”的主题,并且接着随后开始检查“Battery system”的主题,发现概念“Battery system”通过“Part of” 关系与“Power Switch”有关。例如,功率开关可以是电池系统的零件。如上所述,"Part of”关系是工程设备属性领域的信息分类法的成员,其中知识搜索地图70的实体之间的关系的识别可以经由对用户交互方法特定的不同方法而出现。在这里,“Part of”关系仅仅是例子。类似地,连接线712指示实体703(即,“Elimination of need for daily charging batteries”)是实体 702 的 “Advantage”,这是另一种形式的关系。很多其它类型的关系可以存在于知识搜索地图70中的实体之间。包括对现有知识搜索工具的增强的知识搜索和映射系统10的益处的另一例子是自动识别并捕获所关注的搜索或结果的位置的移动,如用户与所呈现的结果集合的交互所指示的。在各种实施例中,用户可使用呈现的知识搜索地图770作为导航设备来改变当前的搜索位置。在图7中,包括实体703的框721指示由实体703表示的主题,即, "Elimination of need for daily charging batteries,, 当 11]"! ^立 。^ 歹Ij子中, 选择(例如,通过用户界面中的点击动作)“Power Switch”实体701的动作将导致搜索位置改变到“Power Switch”的主题。其它实施例可以使用适合于知识搜索地图770呈现的方法的其它导航交互模式。如图7所示,框722是用户可以直接输入新查询的用户可编辑的区。在图7中,将新查询,即,“Hybrid vehicle"输入到搜索框722。当选择“Find”按钮724时,提交新查询。特别地,实体703是实体704的优点,其中,优点是两个查询实体之间的关系。在一些实施例中,用户也可以选择“Hybridvehicle”图标来提交新查询。
图6和7示出在用于物理产品设备设计和制造的搜索活动的背景下根据本发明的方面的应用的实施例。然而,针对物理产品设备设计和制造的背景示出的系统和方法同样可适用于搜索活动的其它领域背景中的实施例。根据本发明的方面的实施例可以在特别配置的计算机系统(例如图8所示的计算机系统800)中实现。图8是根据本发明的方面的计算机实现的实施例的架构图。图8的计算机系统800可以包括处理元件801、显示器803、输入设备805和到数据库807 (或其它计算机可读存储介质)的链路,数据库807提供必要的信息以提供对查询的响应。还可以由位于一个或多个计算机上并且可以由一个或多个微处理器、微控制器或其它处理设备执行的计算机可执行指令来提供实施例。用于执行该系统和方法的计算机可执行指令可以位于处理设备中的存储器内,或者可以通过软盘、硬盘、光盘(CD)、数字多功能盘(DVD)、只读存储器(ROM)或任何其它非瞬态存储介质提供到处理设备。此外,系统可以通过例如互联网(和万维网)、内联网、外联网、虚拟专用网络或其它网络中的一个或多个的网络来访问一个或多个其它计算机、数据库系统等。本领域技术人员将认识到,本文描述的应用、功能模块和/或处理器可以包括硬件、软件、固件或其某种组合。就在各种实施例中所使用的软件或计算机程序代码(有时称为“应用”)而言,它可以存储在任何各种非瞬态存储设备或介质中,并且由一个或多个处理器执行以实现本文描述的系统和方法的明确的、隐含的和/或固有的功能。这种存储设备或介质以及这种处理器可以放置在一起或彼此远离(不管是逻辑地还是物理地)。如本文所使用的,除非另外指示,否则计算机可以采用包括至少一个处理器和存储介质的任何已知的或此后发展的设备的形式。例如,参考图8和9,计算机或计算机系统可以包括服务器98、个人数字助理(PDA)91、膝上型计算机92、便携式音乐设备93、个人计算机94、蜂窝电话95、工作站(未示出)、大型机(未示出)等或其的某种组合。这样的设备可以包括一个或多个输入设备,所述输入设备例如可以包括辅助键盘或键盘、麦克风、视频摄像机、触摸屏等。这样的设备还可以包括一个或多个输出设备,所述输出设备例如可以包括视频屏幕(例如,计算机、蜂窝电话或PDA屏幕)、触摸屏、图像投影系统、扬声器、打印机等。在一些实施例中,数据端口也可以被考虑为输入设备、输出设备或两者。在一些实施例中,各种用户设备90可以与可通过互联网访问的由计算机98管理的知识搜索和映射系统10进行交互。就本文描述的彼此远离的任何元件而言,它们可通过任何各种已知的或此后发展的网络96来传输和/或交换信息,其中,所述网络例如局域网、广域网、虚拟专用网络、内联网、基于计算机的社交网络、线缆网络、蜂窝网络、互联网、万维网或其的某种组合。根据本发明的方面,因为在搜索的过程中获取的相关知识不仅包括可以通过知识搜索工具找出的特定事实,而且包括事实与所提交的查询和其它事实的前后关系、搜索探查的范围和历史、搜索位置变化识别和记录以及基于用户意图的结果过滤能力,所以知识搜索工具向用户提供即时和引人注目的益处。启用了搜索活动的新范例,其中用户能够参加与通过选择的知识库可访问的可用知识的总域(universe)的对话;该对话通过一系列的查询实现。根据本发明的交互式模型,关于前后关系以及搜索范围和历史的隐式信息被捕获并且对用户是可用的。该信息的可用性导致更大的搜索生成力和有效性,因为用户能够以增加对搜索数据的整体理解的方式来理解信息的上下文。
为了说明的目的而提出了示例性和优选实施例的前述详细描述。本文的实施例的公开没有被规定为穷举的,也不是将本发明限制到所描述的精确形式,而是仅仅使本领域的技术人员能够理解本发明可以如何适合于特定的使用或实现。对于理解了本公开益处的本领域技术人员来说,修改和变型的可能性将是显而易见的。示例性实施例的描述没有任何限制的意图,所述示例性实施例可包括容限 (tolerance)、特征尺寸、特定的操作条件、工程规范等,并且其可以在实现之间或随着现有技术的变化而变化,且不应从其暗示任何限制。本公开是关于当前技术发展水平做出的,但也设想进步,以及在未来的改进可考虑那些进步,即,与当时的当前技术发展水平一致。意图是由写出的权利要求和可应用的等效形式来限定本发明的范围。以单数形式提及的权利要求元件并没有被规定为表示“一个且只有一个”,除非明确地如此规定。而且,本公开中的元件、部件、方法或处理步骤都没有被规定为专用于公众,而不管元件、部件或步骤是否在权利要求中被明确地陈述。本文的权利要求元件不应根据35U. S. C. Sec. 112第六段的规定解释,除非明确地使用短语“用于...的装置”来陈述该元件,并且本文的方法或处理步骤不应根据那些规定解释,除非明确地使用短语“用于...的步骤”来陈述所述步骤。因此应理解,可以进行各种修改,以及可以以各种形式和实施例来实现本发明,以及它们可以应用在很多应用中,但是在本文中仅描述了其中的一些。意图是通过所附的权利要求来主张在字面上所描述的其的所有等效形式,包括落在每个权利要求的范围内的所有修改和变型。
权利要求
1.一种知识搜索和映射的基于计算机的方法,所述方法包括提供耦合到至少一个非瞬态存储介质的至少一个计算机处理器,所述至少一个计算机处理器执行一组处理任务,包括 接收与搜索领域有关的查询;将所述查询存储在所述至少一个计算机存储介质中的搜索知识地图中; 将所述查询自动提交到一个或多个知识库; 将对所述查询的一个或多个响应过滤到响应关系子集中;以及使来自响应关系子集的所述响应中的一个或多个关联到所述搜索知识地图中的所存储的查询,其中所述知识地图为所述搜索领域内的一个或多个查询提供相关的信息。
2.如权利要求1所述的方法,还包括使用包括实体-关系-实体三元组的实体-关系模型来产生所述搜索知识地图,包括将从所述一个或多个查询确定的主题表示为实体以及根据信息分类法确定实体之间的关系。
3.如权利要求2所述的方法,其中表示一个或多个查询的所述实体使其关联到对所述查询的一个或多个响应。
4.如权利要求1所述的方法,其中所述响应关系子集被分类为对所述查询的所述一个或多个响应的子组,所述子组通过信息分类法的公共关系与所述查询相关联。
5.如权利要求1所述的方法,其中将所述查询提交到一个或多个知识库包括将所述查询提交到知识搜索引擎以及将所述查询自动格式化为与所述知识搜索引擎相兼容。
6.如权利要求5所述的方法,包括将所述查询格式化为自然语言查询或关键字查询。
7.如权利要求5所述的方法,其中所述知识搜索引擎包括语义索引和搜索工具,而所述一个或多个知识库包括语义分析知识库。
8.如权利要求1所述的方法,其中所述知识库包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。
9.如权利要求1所述的方法,还包括记录搜索会话期间与所述查询有关的用户交互以及将所述用户交互的机器表示存储在所述搜索知识地图中。
10.一种知识搜索和映射系统,包括至少一个计算机处理器,其耦合到至少一个非瞬态存储介质;查询输入模块,其接收与搜索领域有关的查询;将所述查询存储在搜索知识地图中;以及将所述查询提交到一个或多个知识库;结果呈现器,其将对所述查询的一个或多个响应过滤到响应关系子集中;以及搜索事件记录器,其使来自所述响应关系子集的一个或多个响应关联到所述搜索知识地图中的所存储的查询,其中所述知识地图为所述搜索领域内的一个或多个查询提供相关的信息。
11.如权利要求10所述的系统,其中所述至少一个处理器使用包括实体-关系-实体三元组的实体-关系模型来产生所述搜索知识地图,使得从所述一个或多个查询确定的主题被表示为实体,并且根据信息分类法律来确定实体之间的关系。
12.如权利要求11所述的系统,其中表示一个或多个查询的所述实体使其关联到对所述查询的一个或多个响应。
13.如权利要求10所述的系统,其中所述响应关系子集被分类为对所述查询的所述一个或多个响应的子组,所述子组通过信息分类法的公共关系与所述查询相关联。
14.如权利要求10所述的系统,其中所述查询输入模块将所述查询提交到知识搜索引擎并将所述查询自动格式化为与所述知识搜索引擎相兼容。
15.如权利要求14所述的系统,其中所述查询被格式化为自然语言查询或关键字查询。
16.如权利要求14所述的系统,其中所述知识搜索引擎包括语义索引和搜索工具,而所述一个或多个知识库包括语义分析知识库。
17.如权利要求10所述的系统,其中所述知识库包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。
18.如权利要求10所述的系统,其中所述搜索事件记录器记录搜索会话期间与所述查询有关的用户交互,并且将所述用户交互的机器表示存储在所述搜索知识地图中。
19.一种具有存储在至少一个非瞬态计算机可读介质中的计算机可执行指令的计算机程序产品,所述计算机可执行指令在由至少一个处理器执行时执行知识搜索和映射的方法,所述方法包括接收与搜索领域有关的查询;将所述查询存储在所述至少一个计算机存储介质中的搜索知识地图中;将所述查询自动提交到一个或多个知识库;将对所述查询的一个或多个响应过滤到响应关系子集中;以及使来自所述响应关系子集的所述响应中的一个或多个关联到所述搜索知识地图中的所存储的查询,其中所述知识地图为所述搜索领域内的一个或多个查询提供相关的信息。
20.如权利要求19所述的计算机程序产品,其中所述方法还包括使用包括实体-关系-实体三元组的实体-关系模型来产生所述搜索知识地图,包括将从所述一个或多个查询确定的主题表示为实体,以及根据信息分类法来确定实体之间的关系。
全文摘要
知识搜索和映射系统和方法自动构造知识搜索地图,所述知识搜索地图表示所搜索的主题、其相互关系、以及通过例如自然语言或布尔查询的处理检索的有关响应,其中,所述自然语言或布尔查询经由知识搜索工具被自动提交到数据库。
文档编号G06F17/30GK102439594SQ201080020560
公开日2012年5月2日 申请日期2010年3月12日 优先权日2009年3月13日
发明者J·托德亨特, L·Y·布里克曼-韦泽, Y·比亚里奥斯基 申请人:发明机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1