用于分析和合成复杂知识表示的系统和方法与流程

文档序号:13145749阅读:195来源:国知局
分案申请说明本申请是国际申请日为2011年6月22日、于2012年12月21日进入中国国家阶段、申请号为201180031005.5、名称为“用于分析和合成复杂知识表示的系统和方法”的中国发明专利申请的分案申请。相关申请的交叉引用本申请要求对通过引用而完全结合于此、于2010年6月22日提交、标题为\SystemsandMethodsforAnalyzingandSynthesizingComplexKnowledgeRepresentations\的第61/357,266号的美国临时申请的优先权。这一申请也构建于在由相同申请人和/或受让人提交的多份在先申请中公开的概念上,这些在先申请包括阅读者除了参考下文讨论的背景之外也作为背景而参考的以下申请:于2011年6月15日提交、标题为\SystemsandMethodsforAnalyzingandSynthesizingComplexKnowledgeRepresentations\的第13/161,165号美国专利申请;于2009年6月4日提交、标题为\System,MethodandComputerProgramforTransforminganExistingComplexDataStructuretoAnotherComplexDataStructure\的第12/477,977号美国专利申请;于2006年8月31日提交、标题为\Complex-AdaptiveSystemforProvidingaFacetedClassification\、现为第7,596,574号美国专利的第11/469,258号美国专利申请;以及于2006年3月30日提交、标题为\System,Method,andComputerProgramforConstructingandManagingDimensionalInformationStructures\的第11/392,937号美国专利申请。

背景技术:
广而言之。知识表示是如下活动,该活动使抽象知识作为具体数据结构而明确以支持基于机器的存储、管理和推理系统。存在用于利用根据各种类型的知识表示模型构造的知识表示(KR)的常规方法和系统,这些KR包括:结构化受控词汇表,比如分类法、辞典和按面分类;形式规范,比如语义网络和本体论;以及非结构化形式,比如基于自然语言的文档。分类法是如下KR结构,该KR结构将类别组织成分级树并且关联类别与相关对象(比如物理项(item)、文档或者其它数字内容。通常在也被称为父类型-子类型关系、广义性-专门性关系或者父-子关系的继承关系方面组织分类法中的类别或者概念。在这样的关系中,子类别或者概念具有与它的父代相同的性质、行为和约束以及一个或者多个附加性质、行为或者约束。例如,知识语句“狗是哺乳动物”可以在分类法中由通过父-子分级关系链接的、被标注为“哺乳动物”和“狗”的概念/类别编码。这样的表示对狗(子概念)是哺乳动物(父概念)类型、但是并非每个哺乳动物必然是狗这样的概念编码。辞典是表示术语(比如用于信息检索的搜索关键词)的KR,这些术语经常编码为单字词名词概念。在辞典中的术语/概念之间的链接通常被划分成以下三个类型的关系:分级关系、等价关系和关联关系。分级关系用来链接在范围上比彼此更窄和更宽的术语,这与在分类法中的概念之间的关系相似。沿用前例,“狗”和“哺乳动物”是由分级关系链接的术语。等价关系链接可以作为搜索术语而相互代替的术语,比如同义词或者近义词。例如,可以在一些上下文中通过等价关系链接术语“狗”和“犬科”。关联关系链接如下有关术语,这些术语的关系既不是分级也不是等价。例如,搜索术语“狗”的用户也可能想要看见从“饲养员”的搜索中返回的项,并且可以针对该对术语在辞典数据结构中对关联关系进行编码。按面分类基于信息具有多维质量并且可以按照许多不同方式来编码这样的原理。信息领域的主题被细分成用于表示这一维度性的面(或者更简称为类别)。领域的属性在面分级中有关。继而基于这些属性对领域内的对象进行描述和分类。例如,可以使用颜色面、材料面、款式面等对物理或者基于web的服装店中提供销售的衣物汇集进行分类,其中每个面具有表示不同类型的颜色、材料、款式等的多个分级属性。按面分类经常在按面搜索系统中例如用来允许用户按照任何希望的面排序(比如按照先颜色后款式、按照先款式后颜色、按照先材料后颜色后款式或者按照任何其它希望的面优先顺序搜索衣物汇集。这样的按面分类与通过分类法的分类对照,在后者中,类别分级是固定的。语义网络是表示在概念之间的各种类型的语义关系的网络结果或者对网络结构进行编码或者实例化的数据结构。语义网络通常被表示为由表示概念的顶点和用链接概念对的关系类型标注的边构成的有向或者无向图。语义网络的示例是WordNet,这是英语语言的词汇数据库。在WordNet中定义的一些常见类型的语义关系是整体-部分关系(A是B的部分)、上下位关系(A是B的一种)、同义词(A与B同义)和反义词(A与B反义)。本体论是对概念和在那些概念之间的关系进行编码的KR结构,该KR结构限于它用来建模的现实或者虚拟世界的特定领域。在本体论中包括的概念通常表示术语在它们应用于被建模或者分类的领域时的特定含义,并且包括的概念关系通常表示那些概念在领域内被相关的方式。例如,与字词“卡”对应的概念可以在关于纸牌游戏领域的本体论和关于计算机硬件领域的本体论中具有不同含义。一般而言,所有上文讨论的KR类型以及其它常规示例是用于在抽象概念和在那些概念之间的关系方面对人类知识进行建模并且用于使该知识可由机器(比如计算机)访问以用于执行各种需要知识的任务的工具。这样,人类用户和软件开发者常规地使用他们的人类知识来构造KR数据结构,并且将完成的KR数据结构人工编码成机器可读形式作为将存储于机器存储器中并且由各种机器执行的功能访问的数据结构。

技术实现要素:
一个实施例涉及一种用于生成复杂知识表示的方法,该方法包括:接收指示请求上下文的输入;用处理器将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。另一实施例涉及一种用于生成复杂知识表示的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:接收指示请求上下文的输入;将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于生成复杂知识表示,其中指令在被执行时,执行:接收指示请求上下文的输入;将一个或者多个规则应用于表示至少一个基本概念、至少一个基本概念关系或者至少一个基本概念和至少一个基本概念关系的基本数据结构;基于一个或者多个规则的应用,根据请求上下文合成一个或者多个附加概念、一个或者多个附加概念关系或者一个或者多个附加概念和一个或者多个附加概念关系;并且使用附加概念中的至少一个附加概念、附加概念关系中的至少一个附加概念关系或者附加概念中的至少一个附加概念和附加概念关系中的至少一个附加概念关系,根据请求上下文生成复杂知识表示。另一实施例涉及一种用于解构原有知识表示的方法,该方法包括:接收与原有知识表示对应的输入;用处理器应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及一种用于解构原有知识表示的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:接收与原有知识表示对应的输入;应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于解构原有知识表示,其中指令在被执行时,执行:接收与原有知识表示对应的输入;应用一个或者多个规则以将原有知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在基本数据结构中包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及一种用于支持在知识表示之间的语义互操作性的方法,该方法包括:对于多个输入知识表示中的每个输入知识表示,用处理器应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且用处理器在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及一种用于支持在知识表示之间的语义互操作的系统,该系统包括存储处理器可执行指令的至少一个非瞬态计算机可读存储介质,这些指令在由至少一个处理器执行时,执行:对于多个输入知识表示中的每个输入知识表示,应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及用多个计算机可执行指令编码的至少一种非瞬态计算机可读存储介质,这些指令用于支持在知识表示之间的语义互操作性,其中指令在被执行时,执行:对于多个输入知识表示中的每个输入知识表示,应用一个或者多个规则以将输入知识表示解构成一个或者多个基本概念、一个或者多个基本概念关系或者一个或者多个基本概念和一个或者多个基本概念关系;并且在共享基本数据结构中针对多个输入知识表示中的每个输入知识表示包括基本概念中的至少一个基本概念、基本概念关系中的至少一个基本概念关系或者基本概念中的至少一个基本概念和基本概念关系中的至少一个基本概念关系的表示。另一实施例涉及一种用于合成复杂指示表示的计算机实施的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。其中,在所述方法中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。其中,在所述方法中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。其中,在所述方法中,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。另一实施例涉及至少一个非瞬态计算机可读存储介质,所述至少一个非瞬态计算机可读存储介质存储计算机可执行指令,所述计算机可执行指令在被执行时执行用于合成复杂知识表示的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过经由至少一个处理器对存储的指令的执行向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。其中,在所述至少一个非瞬态计算机可读存储介质中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。其中,在所述至少一个非瞬态计算机可读存储介质中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。其中,在所述至少一个非瞬态计算机可读存储介质中,其中在所述第一概念和所述第二概念之间的所述外在关系对在所述第一概念和所述第二概念之间的分级关系进行编码。另一实施例涉及一种装置,包括:至少一个处理器;以及至少一个存储介质,所述至少一个存储介质存储处理器可执行指令,所述处理器可执行指令在由所述至少一个处理器执行时执行用于合成复杂知识表示的方法,所述方法包括:从数据消耗者接收上下文;根据所述上下文标识基本知识表示中的包括第一概念的一个或者多个基本组成;以及通过向所述一个或者多个基本组成应用一个或者多个规则来生成复杂知识表示,其中生成所述复杂知识表示包括合成在所述基本知识表示中不存在的复杂概念,以及在所述复杂知识表示中包括合成的所述复杂概念,其中合成所述复杂概念包括接合所述第一概念和不与所述第一概念分级地有关的基本概念以形成合成的所述复杂概念。其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括内在关系,所述内在关系在集合中接合概念以创建复杂概念。其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和通过接合所述第一概念与所述基本概念而合成的所述复杂概念之间的内在关系进行编码。其中,在所述装置中,其中所述第一概念和与所述第一概念接合以合成所述复杂概念的所述基本概念形成用于所述复杂概念的概念定义。其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中包括外在关系,所述外在关系描述在概念对之间的特征。其中,在所述装置中,其中生成所述复杂知识表示包括在所述复杂知识表示中对在所述第一概念和所述复杂概念之间的所述内在关系与在所述第一概念和第二概念之间的外在关系二者进行编码。前文是由所附权利要求限定的本发明的非限制性发明内容。附图说明附图并非旨在于按比例绘制。在附图中,在各图中图示的每个相同或者接近相同的部件。出于清楚的目的,可以不在每幅图中标注每个部件。在附图中:图1是图示了根据本发明的一些实施例的用于实施原子知识表示模型的示例性系统的框图;图2A图示了根据本发明的一些实施例的示例性复杂知识表示;图2B图示了根据本发明的一些实施例的原子知识表示模型的示例性基本数据结构;图3图示了根据本发明的一些实施例的示例性数据规划;图4图示了根据本发明的一些实施例的用于分析复杂知识表示的示例性方法;图5是图示了根据本发明的一些实施例的用于实施分析和合成复杂知识表示的示例性分布式系统的框图;图6是图示了根据本发明的一些实施例的用于分析复杂知识表示以生成基本数据结构的示例性方法的流程图;图7是图示了根据本发明的一些实施例的用于从基本数据结构合成复杂知识表示的示例性方法;图8是图示了根据本发明的一些实施例的示例性知识处理规则集的表;图9图示了可以从示例性自然语言文本推导的知识表示的示例;图10图示了可以从示例性辞典分析的基本数据结构的示例;并且图11是图示了用于在实现本发明的一些实施例时使用的示例性计算系统的框图。具体实施方式如上文讨论的那样,通过常规方法创建的知识表示(KR)数据结构对针对特定领域或者上下文建模的特定人类知识集进行编码和表示。由于KR通常由人类开发者构造并且以完整形式编程到机器存储器中,所以常规KR仅包含人类用户原先用来对它编程的人类知识子集。例如,KR可以对知识语句“狗是哺乳动物”编码,并且它也可以表达关于作为哺乳动物的动物的语句或者断言,比如“哺乳动物产生乳汁以喂养它们的幼崽”。发明人已经认识到这样的事实组合在与适当逻辑和语义规则组合时可以支持广泛人类推理从而使起初在KR内未作为事实而播种的显式推论(比如“狗产生乳汁用于喂养它们的幼崽”)成为显式。发明人已经领会到通过这样的推断扩展KR数据结构可以用来支持各种基于知识的活动和任务,比如推断/推理(如上文所示)、信息检索、数据挖掘和其它形式的分析。然而,如上文讨论的那样,用于对KR进行构造和编码的方法已经常规上限于人工输入完整KR结构以用于由机器(比如计算机)访问和使用。沿用上例,虽然充当KR设计者的人类个人可以隐式理解为什么“狗产生乳汁用于喂养它们的幼崽”这一事实成立,但是为了使它成立而必须保持的性质(在这一情况下为比如传递性和继承性这样的性质)并不常规地是KR的显式部分。换言之,可以指导创建新知识的任何根本规则集并未常规地编码为KR的部分,而是实际上由人类设计者在构造KR时从系统以外应用。常规方式的先前未认识到的结果是可以在KR中表达知识以用于由机器使用,但是KR本身不能由机器创建。人类被迫对知识领域建模以用于由机器消耗。遗憾的是,由于人类知识如此极为广泛并且在许多情况下是主观的,所以对所有知识领域建模在技术上不可行。另外,由于如此多的知识必须被显式编码为数据,所以所得数据结构随着知识领域增长而快速变得无比庞大。由于常规KR并未用它们的用于知识创建的根本理论或者实践来编码为组成知识表示模型的数据的部分,所以它们的所得数据结构可能变得很复杂和不实用。换言之,由于知识表示无法由机器创建,所以它常规地必须被提供为显式数据或者以别的方式通过逻辑或者统计手段来演绎或者归纳。因此,常规KR方式导致多个问题:大而复杂的数据结构:常规地对知识表示进行编码的数据结构构建和维护起来复杂。甚至相对简单的机器可读知识领域(比如关于狗和哺乳动物的简单语句)也可能生成数量级比它的自然语言对应数据更大的数据量。依赖于领域专家:指引KR的实践的根本理论必须在KR数据结构的常规创建中由人类表达。这是在产生这些至关重要的数据资产时排除多数人和所有机器的耗时活动。作为结果,迄今为止的大多数人类知识已经保持隐式并且在计算范畴以外。在使用之前创建数据:知识常规地在它被调用以用于特定使用时这样的时间之前被建模为数据,如果无需该知识,则这存在高成本并且潜在地存在浪费。因而,发明人已经认识到如果知识可以仅随需由机器创建,则可以大量减少数据产生和存储要求。大规模数据和处理成本:常规KR系统必须在创建新事实或者答复查询的服务中在很大数据结构内推理。这一规模负担表示常规KR系统中的重大挑战,这是可以通过更多使用一种用于创建根本数据结构的及时方法而不是常规的在使用之前的数据方法来减少的负担。集成和互操作性挑战:语义互操作性(两个不同KR共享知识的能力)是在不同模型之下创建并且按照不同方式表达各种KR时的大规模困难挑战,该挑战经常应对主观和含糊主题。精确度和准确推理的能力经常跨越多个不同KR而丢失。就这一点而言,发明人已经领会到如果包括用于如何创建知识的根本理论作为KR的部分,则跨越不同KR的知识协调可能变成棘手问题。因而,根据本公开内容的一些实施例提供一种对知识创建规则进行编码以使创建知识表示的过程自动化的系统。一些实施例组合新的知识表示综合方式与用于创建和管理从这样的方式推导的所得数据结构的计算系统。一些实施例组合更压缩的(原子)数据集与对根本知识创建进行编码的生成规则集而不是将领域中的所有知识建模为显式数据。这样的规则可以在一些实施例中在需要或者希望创建新知识并且显式表达它为数据时由系统应用。从上文讨论中应当领会到,这样的技术的益处可以在至少一些情形中是明显减少系统中的数据量以及提供用于基于机器的新知识创建(合成)的新能力和应用。然而,应当领会到并非根据本发明的每个实施例可以解决常规方式的每个标识出的问题,并且一些实施例可以不解决这些问题中的任何问题。一些实施例也可以解决除了这里叙述的问题之外的问题。另外,并非每个实施例可以提供这里讨论的益处中的所有或者任何益处,并且一些实施例可以提供未叙述的其它益处。一些实施例也提供用于复杂知识表示,比如分类法、本体论和按面分类,以不仅在数据级而且在语义级互操作(含义互操作性)的技术。可以在一些实施例中赋予的并且可以跨越许多新的和现有应用领域而应用的其它益处包括:由更简单和更经济的数据结构所赋予的知识表示的产生和应用二者中的成本更低;用于新知识创建的可能性;由及时随需知识所赋予的更可缩放的系统;以及支持来自用户和数据消耗者的“上下文”作为输入变量。在及时基础上应用合成和分析知识处理规则以创建知识表示数据结构的、根据本公开内容的一些实施例的动态性质可以提供可以提供比预先对整个知识领域进行分析和建模的常规方法更经济的益处。通过在KR内并入根本知识创建规则集,可以减少系统中的数据量,从而提供更经济的数据管理系统并且提供用于知识管理的全新应用。因此,在一些实施例中,可以通过减少数据可伸缩性的负担而除非需要数据则才创建它来降低KR系统的产生和维护成本。一旦被创建,对复杂知识建模的数据结构在一些实施例中比在常规系统中相较而言更小,因为它们仅包含与手头的任务相关的数据。这转而可以减少下游应用(比如在这些知识模型之上工作的推论引擎或者数据挖掘工具)的成本。根据本公开内容的一些实施例的综合计算的方式也支持知识表示和数据管理中的全新能力。一些实施例可以提供改进的对“可能性”(即从现有数据之中创建全新知识的表示)的支持。例如,这样的可能性的能力可以对于创造活动(比如教育、新闻和艺术)有用。图1图示了根据本发明的一些实施例的示例性系统100,可以在一些实施例中运用该系统以用于实施在复杂知识表示(KR)的分析和合成中涉及到的原子知识表示模型(AKRM)。在示例性系统100中,AKRM可以被编码为计算机可读数据并且存储于一个或者多个有形非瞬态计算机可读存储介质上。例如,AKRM可以用如下数据规划存储于非易失性计算机存储器中的数据集110中,下文给出该数据集的一些示例,该数据规划被设计成支持基本和复杂知识表示数据结构。在一些实施例中,AKRM可以包括一个或者多个基本数据结构120和一个或者多个知识处理规则130。在一些实施例中,规则130可以由系统100用来解构(分析)一个或者多个复杂KR以生成基本数据结构120。例如,系统100可以包括一个或者多个计算机处理器和一个或者多个计算机存储器硬件部件,并且可以用计算机可执行指令对存储器编码,这些计算机可执行指令在由一个或者多个处理器执行时,使系统100的一个或者多个处理器在分析一个或者多个复杂KR时使用规则130以生成AKRM的基本数据结构120。也可以用如下指令对存储器编码,这些指令对一个或者多个处理器编程以使用规则130以从基本数据结构120合成新复杂KR。在一些实施例中,计算机存储器可以被实施为用计算机可执行指令编码的一个或者多个有形非瞬态计算机可读存储介质,这些计算机可执行指令在被执行时使一个或者多个处理器执行这里描述的功能中的任何功能。不同于先前知识表示系统,根据本发明的一些实施例的系统(比如系统100)可以组合数据结构和知识处理规则以创建被编码为数据的知识表示模型。在一些实施例中,规则可以未被编码为知识(例如,作为规则或者公理,这些规则或者公理描述特定领域内的知识边界或者约束),而实际上被编码为用于创建表示新知识的数据结构的构造和解构规则。除了用于生成如下隐式事实的“推论规则”之外(这些隐式事实是由原有KR给定的显式概念的逻辑结果),在一些实施例中还可以用“知识处理规则”对知识表示模型进行编码,可以应用这些“知识处理规则”以从原有KR数据结构创建可以并非隐式的新知识。例如,始于两个显式知识语句“玛丽是人”和“所有人是人类”,可以应用推论规则以确定显式知识语句“玛丽是人类”,这是先前两个语句的逻辑结果。在根据本发明的一些实施例的不同示例中,始于两个显式知识语句“玛丽是鲍勃的好友”和“鲍勃是查理的好友”,可以应用对好友关系的含义建模的示例性知识处理规则以确定新知识语句“玛丽是查理的好友”。显然,这样的知识处理规则的应用可以产生新知识,该新知识未必是在原有输入KR中给定的显式知识的逻辑结果。如上文描述的那样,根据本发明的一些实施例的知识表示模型(包括与对概念和概念关系进行编码的数据结构相关联地存储的知识处理规则(如有别于或者补充逻辑推理规则的))可以对如何可以创建和/或分解新的和潜在非隐式知识的框架建模。这样聚焦于知识的合成可以将系统(比如系统100)带入新应用领域中。尽管现有系统聚焦于演绎推理(即其中通过精确演绎现有事实和论证(argument)来收集见解),但是根据本发明的一些实施例的系统可以支持归纳推理以及其它类型的理论构建(即其中现有事实可以用来支持新知识的概率预测)。在根据本发明的一些实施例中,系统(比如系统100)可以宽松地基于基于概念语义的框架,从而对语义原语(例如“原子”或者“基本”概念)和规则(原则)进行编码,这些规则指导如何可以组合这样的原子结构以创建更复杂的知识。然而,应当领会到,根据本发明的实施例的系统可以在许多这样的框架内工作,因为本发明的方面不限于知识表示的任何特定理论、模型或者实践。在一些实施例中,系统(比如系统100)可以被设计成与对这些框架建模的广泛方法和技术(例如,实施为软件应用或者部件)对接。例如,对接分析部件(比如分析引擎150)可以将输入复杂KR160解构成基本数据结构120。合成部件(比如合成引擎170)可以使用基本数据结构120来构造新输出复杂KR190。在一些实施例中,分析引擎150可以例如通过由系统100的一个或者多个处理器执行适当计算机可读指令、通过应用知识处理规则130中的一个或者多个知识处理规则以将输入KR160的数据结构解构成更基本构造来分析输入复杂KR160。在一些实施例中,在AKRM110的基本数据结构120内包括的最基本构造可以表示信息和信息关系的基础构建块的最小集合,这些信息和信息关系聚合地提供用来对输入数据结构进行分类的信息携带能力。可以从任何适当来源(包括来自与系统100交互的用户或者软件应用的直接输入)获得输入KR160。在一些实施例中,可以通过与各种数据库技术(比如关系数据库系统或者基于图形的数据库系统)对接获得输入KR160。应当领会到,可以按照任何适当形式以任何适当方式获得输入KR160,因为本发明的方面就这一点而言不受限制。例如,图2A图示了例如使用系统100的用户或者软件应用可以向分析引擎150输入的小型复杂KR200(在这一示例中为分类法)。复杂KR200包括由各种分级关系链接的概念集。例如,被标注为“动物”的概念210在父-子关系中链接到被标注为“宠物”的概念220和被标注为“山居动物”的概念230。在分级的每级,概念实体表示含义单位,该含义单位可以被组合以创建更复杂语义或者可能被解构成更基本语义。例如,“山居动物”的复杂含义可以包括概念“山居”和“动物”。在一些实施例中,系统100可以例如通过分析引擎150解构复杂KR(比如复杂KR200)以发现基本概念,这些基本概念包括复杂KR的复杂概念。例如,图2B图示了可以从复杂KR200的分析和解构中产生的基本数据结构300。在基本数据结构300中,已经发现了被标注为“山居动物”的复杂概念230包括被标注为“山居”的更基本概念235和被标注为“动物”的更基本概念240。在这一示例中,“山居”和“动物”表示比被标注为“山居动物”的更复杂概念更基本的概念,因为可以组合概念“山居”和“动物”以创建被标注为“山居动物”的概念。类似地,已经发现了被标注为“家养狗”的复杂概念250包括被标注为“家养”的更基本概念255和被标注为“狗”的更基本概念260,并且已经发现了被标注为“暹罗族猫”的复杂概念270包括被标注为“暹罗族”的更基本概念275和被标注为“猫”的更基本概念280。此外,每个新发现的基本概念已经从包括它的复杂概念继承了概念关系。因此,“家养”、“狗”、“暹罗族”和“猫”是“宠物”的子代;“山居”和“动物”(概念240)是“动物”(概念210)的子代;并且“山居”和“动物”(概念240)均为被标注为“狮子”的概念290和被标注为“山羊”的概念295二者的父代。注意,虽然标签“动物”归于基本数据结构300中的概念210和概念240二者,但是两个概念仍然可以表示在知识表示分级内作用不同的不同抽象含义。在一些实施例中,“标签”或者“符号”可以被接合成抽象概念以提供用于概念和关系的人类和/或机器可读术语或者标签以及提供用于各种基于符号的处理方法(比如文字分析)的基础。标签可以提供人类和/或机器可辨别的知识表示实体并且可以从源领域的唯一词汇表中推导。因此,由于可以从在领域中呈现的语言和术语抽取向每个概念元素分配的标签,标签本身可能并未完全描述它们用来命名的抽象概念和概念关系,因为在人类知识中理解那些抽象实体。类似地,在一些实施例中,应当领会到在知识表示模型中的抽象概念与那些概念可以用来描述或者分类的对象之间的差异。对象可以是现实物理或者虚拟世界中的可以由概念描述的任何项(例如,对象的示例是文档、网页、人物等)。例如,现实世界中的个人可以由被标注为“鲍勃”的概念抽象表示。待描述、分类或者分析的领域中的信息可以涉及虚拟或者物理对象、过程和在这样的信息之间的关系。在一些示例性实施例中,可以在对驻留于网页内的内容分类时使用如这里描述的复杂KR。其它类型的领域在一些实施例中可以包括文档贮存库、用于音乐的推荐系统、软件代码贮存库、工作流程和业务过程的模型等。在一些实施例中,待分类的领域的对象可以被称为内容节点。内容节点可以包括使用知识表示模型负责于分类、描述、分析等的任何对象。例如,内容节点可以是文件、文档、文档的组块(比如注解)、图像或者存储的字符串。内容节点可以引用物理对象或者虚拟对象。在一些实施例中,内容节点可以被包含于内容容器中,这些内容容器提供可以通过其取回内容节点的可寻址(或者可定位)信息。例如,通过URL可寻址的网页的内容容器可以包含形式为文本和图像的内容节点。内容可以与内容节点相关联以提炼一些含义(比如内容节点的描述、目的、用法或者意图)。例如,现实世界中的内容节点的方面可以由抽象知识表示中的概念描述。在复合提炼水平方面通过概念与其它实体的关系并且在结构上在其它更基础知识表示实体(例如,关键词和词素)方面定义概念。这样的结构在这里被称为概念定义。在一些实施例中,可以通过如下两个基础类型的概念关系使概念相关:内在类型,该类型指代用于创建更复杂概念的在基本概念之间的接合(例如,在基本数据结构300中的“山居”、“动物”和“山居动物”之间的关系);以及外在类型,该类型指代在复杂关系之间的接合。外在关系可以描述在概念对之间的特征,比如等价、分级(例如,在“动物”与“宠物”之间的关系)和关联。另外,在一些实施例中,外在和内在概念关系本身也可以被描述为概念类型,并且它们可以被归类成更复杂关系。例如,关联关系“与……结婚”可以包括关系概念“结婚”和“与”。在一些实施例中,被存储为系统100中的基本数据结构120的AKRM数据模型的总体组织可以被编码为按面数据结构,其中概念实体是在分级(外在关系)中显式相关以及在集合中接合成创建复杂概念(内在关系)。另外,如上文讨论的那样,可以使用概念对这些外在和内在关系本身归类。然而,应当领会到,可以在表示AKRM时利用任何适当类型的知识表示模型或者理论构造(包括任何适当类型的概念关系),因为本发明的方面就这一点而言不受限制。作为示例,图3提供根据本发明的一些实施例的可以在系统100的数据集110中运用的示例性数据规划350。这样的数据规划可以被设计成能够对复杂知识表示数据结构(复杂KR)(比如本体论和分类法)以及将复杂KR分解成的原子知识表示数据结构(例如,基本数据结构120)进行编码。在规划350中,可以接合概念以使用多对多关系来组成更复杂类型(具有类型)。以这一方式,模型中的核心概念实体可以根据由数据建模的复杂知识表示的性质来表示广泛多样化简单性或者复杂性。通过使用多对多关系将符号、规则和对象接合到这些概念,这样的规划可以管理用于对广泛知识表示建模的数据。在如图3中所示的规划350中,矩形框表示实体集,(例如,可以被编码为数据库中的主要对象的现实世界对象)以及抽象概念、引用概念的抽象人类和/或机器可读符号以及应用于知识表示中的概念的规则。每个实线连接符表示具有如由菱形表示的关系类型的、在两个实体集之间的关系。“N”表示关系的参与基数;在这里,关系为多对多,这指示每个实体集的许多实体可以参与与参与关系的其它实体集的实体的关系并且反之亦然。对照而言,在菱形的两侧上被标注为“1”的关系将表示一对一关系;在一侧上被标注为“1”而在另一侧上被标注为“N”的关系将表示一对多关系,其中第一类型的一个实体可以参与与第二类型的许多实体的关系,而第二类型的每个实体可以参与与第一类型的仅一个实体的该关系;等等。在一些实施例中,可以使用任何适当数据库和/或其它数据编码技术在一个或者多个数据库表中根据规划350对知识表示的数据结构进行编码。例如,在一些实施例中,用于KR数据结构的数据集可以被构造为表的计算机可读表示,其中每行表示在一对概念之间的关系。例如,数据表的一个示例可以具有四个属性列,这些属性列包括“概念1”属性、“概念2”属性、“关系”属性和“类型”属性,从而将用于表的每行的三向关系建模为:“概念1通过类型(例如,外在或者内在)的关系概念来与概念2相关。例如,具有属性(列实体){概念1:“锤子”;概念2:“钉子”;关系“工具”;类型:“外在”
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1