与特定查询相关的不一致和不确定本体的推理方法和设备的制作方法

文档序号:6578647阅读:159来源:国知局
专利名称:与特定查询相关的不一致和不确定本体的推理方法和设备的制作方法
技术领域
本发明一般地涉及语义web和本体推理领域,更具体而言,涉及用于解决知识和 本体的不确定与不一致问题的推理方法和设备。
背景技术
本体(Ontology)是对真实世界中的实体以及实体之间的关系的描述。语义web 很大程度上依赖于本体的质量和正确性。然而,现实中的知识和信息常常是不确定的,从而 导致本体也具有不确定性。所谓不确定的本体(uncertain ontology)指的是本体的正确 性是不确定的。本体的不确定性也可能由多种原因引起,例如专家在主观上的不确定性、来 自原始本体的不确定性、自动本体学习工具的不确定性等等。本体的不确定性越高,其不正 确的可能性越大。本体的不确定性也常导致本体的不一致性。所谓不一致的本体(inconsistent ontology)指的是该本体中存在错误或冲突,从而导致本体中的某些概念无法被正确地解 释。本体的不一致可能由多种原因引起,例如错误表示、一词多义、从其它形式的转换、来自 多个源的集成等等。在进行本体推理时,不一致的本体将导致错误的回答,还会导致错误的 语义理解和知识表达。由于在语义web中大量存在不确定且不一致的本体,并且通常难以确保本体的质 量,使得对本体的查询得到错误结果或者无法得到结果。尽管修改这种不完备的本体是一种有效的策略,但是修改本体代价较高、不易操 作,而且修改之后容易引起其它关联的问题,所以开发一种针对不确定与不一致本体的推 理方法有时更加有效并易于执行。就是说,在不修改原始本体的情况下,采用一种非标准的 推理方法,以得到尽可能正确的查询结果。当前,本体推理主要是基于逻辑推理(logical reasoning)的。随着本体描述语 言(例如web本体语言(0WL))的出现及其与描述逻辑(DL)的紧密关系,新型的DL推理机 可以有效地检测出不一致的本体。在现有技术中,已有一些研究者对本体的不确定性和不一致性加以研究。例如,在GuilinQi、Jeff Z. Pan和Qiu Ji所发表的文章“Extending Description Logics with Uncertainty Reasoning in Possibilistic Logic,, (Proceedings of the 9th European Conference on Symbolic and Quantitative Approaches to Reasoning with Uncertainty—ECSQARU 2007)(下称“对比文献1 ”)中,对描述逻辑作了概率扩展,从 而对不确定本体进行推理。但是该方法通过一个递减函数从所有本体元素中逐步删除可信 度低的元素,效率较低。此外,它仅对查询为“真”的情况作了判断,没有对查询为“假”的 情况作处理。另夕卜,在Z. Huang、F. van Harmelen禾口A. ten Teije所发表的文章"Reasoning with inconsistent ontologies,, (Proceedings of the International Joint Conference on Artificial Intelligence_IJCAI,05,2005)中提出一种线性扩展策略,用于对不一致的本体进行推理而没有对原始本体进行修改。但是该方法没有考虑本体的不确定性。还有,在Silvia Calegari 和 Elie Sanchez 所发表的文章"A Fuzzy Ontology-Approach to improve Semantic Information Retrieval" (Proceedings of URSW,2007)中定义了一种模糊本体用于语义信息检索,其中考虑了本体的不确定问题,但 没有提出具体的解决方案。综上所述,传统的推理方法对不确定与不一致本体很难得到正确的查询结果,而 且处理效率很低。因此,需要一种新型推理方法,能够同时考虑到本体的不确定及不一致问 题,并具有较高的处理效率。

发明内容
鉴于现有技术中存在的上述问题而研制了本发明。本发明提出了一种对不确定及不一致本体的推理方法与设备。首先,本发明使用 概率扩展方法,用于得到所有本体元素的可信因子(confidence factor,CF)0之后采用一 递增选择函数逐步选择与查询相关的本体元素,并同时判断查询为“真”和“假”的情况,从 而在不修改本体的前提下得到尽可能正确的查询结果。该方法的效率较高,同时考虑了本 体的不确定及不一致问题,并可以将查询的所有回答(即查询结果)、相应推理路径、以及 回答的置信度返回给用户,使用户可以更加方便地选择最可信的结果。根据本发明第一方面,提出一种对不确定本体的推理方法与设备,根据该方法和 设备可以在不修改现有本体的基础上,针对用户提出的查询,得到尽可能正确的推理结果。 具体而言,该本体推理方法包括如下步骤a.输入本体与查询;b.利用选择函数选择本体 中与查询相关的元素集合;c.检测利用所选元素集合能否推理出查询结果;以及d.如果不 能推理出任何查询结果,则递增选择函数的相关度并重复上述步骤b和c,如果能够推理出 查询结果,则输出查询结果和相应推理路径。另外,该方法还可以包括对不确定本体进行概 率扩展,以为每个本体元素赋予一个可信因子,用于表示该元素的可信程度,并根据查询结 果所涉及的推理路径上的各个本体元素的可信因子来计算相应查询结果的置信度。相应地,本发明还提出一种对不确定本体的推理设备,其包括本体输入装置,用 于输入本体;查询输入装置,用于输入查询;递增选择装置,用于利用选择函数选择所输入 的本体中与查询相关的元素集合;查询结果检测装置,用于检测利用递增选择装置所选的 元素集合能否推理出查询结果;推理路径记录装置,用于在查询结果检测装置确定能够推 理出查询结果的情况下,记录与查询结果相对应的推理路径;以及输出装置,用于输出推理 出的查询结果和相应的推理路径。其中,在查询结果检测装置确定利用递增选择装置所选 的元素集合不能推理出任何查询结果的情况下,递增选择装置递增选择函数的相关度以更 新元素集合,并且查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结^ o根据本发明第二方面,在上述不确定本体推理方法的基础上,本发明还进一步提 出了针对不确定和不一致本体的推理方法。该方法可同时判断查询的“真”回答和“假”回 答,从而得到不一致本体的所有查询结果。最后将查询结果根据置信度大小排序,使用户可 以方便选择最可信的结果。具体而言,该不确定和不一致本体的推理方法还包括如下步骤 a.输入本体与查询;b.利用选择函数选择本体中与查询相关的元素集合;c.检测利用所选元素集合能否推理出查询结果;d.如果不能推理出任何查询结果,则递增选择函数的相关 度并重复上述步骤b和c,如果能够推理出查询结果,则记录查询结果和相应推理路径,并 递增选择函数的相关度并重复上述步骤b和c ;以及e.当所选元素集合已经包含本体的所 有元素或者选择函数无法再选出与查询相关的元素时,输出所记录的所有查询结果和相应 推理路径。类似地,该方法也可以包括对不确定本体进行概率扩展,以为每个本体元素赋予 一个可信因子,用于表示该元素的可信程度的步骤。并且,根据查询结果所涉及的推理路径 上的各个本体元素的可信因子,可以计算出相应查询结果的置信度,并根据不同结果置信 度的大小对查询结果进行排序。相应地,本发明所提出的不确定和不一致本体推理设备包括本体输入装置,用于 输入本体;查询输入装置,用于输入查询;递增选择装置,用于利用选择函数选择所输入的 本体中与查询相关的元素集合;查询结果检测装置,用于检测利用递增选择装置所选的元 素集合能否推理出查询结果;查询结果记录装置,用于在查询结果检测装置确定能够推理 出查询结果的情况下,记录查询结果;推理路径记录装置,用于记录与查询结果相对应的推 理路径;以及输出装置,用于输出所记录的查询结果和相应推理路径,其中,无论查询结果 检测装置确定能否推理出查询结果,递增选择装置都要递增选择函数的相关度以更新元素 集合,并且查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结果,直 到当所选元素集合已经包含本体中的所有元素或者选择函数无法再选出与查询相关的元 素时,输出装置输出所记录的所有查询结果和相应推理路径。与现有技术相比,本发明的主要优势在于1.根据本发明,能够针对不确定和不一致本体得到尽可能正确的查询结果。这使 得用户不需要花费较大代价修改本体。2.本发明的推理方案采用了递增选择函数,该函数能选择与特定查询相关的元 素,从而能够最快地得到推理所需元素并得到查询结果。此外,该函数仅选取了与查询相关 的元素,不涉及不相关的元素,因此最大程度上避免了其他不确定、不一致元素的干扰。3.利用本发明所得到的查询结果不仅包括对“真”、“假”回答的判断,而且包括具 体的推理路径以及每一回答对应的置信度。从而,用户能够得到更多有用信息,并可方便地 根据置信度大小选择最可信的查询结果。从下面结合附图的详细描述中,可以看出本发明的其他特征和优点。注意,本发明 的范围并不限于图中所示的示例或者任何具体的实施例。


结合附图,从下面对本发明实施例的详细描述,将更好地理解本发明,附图中类似 的参考标注指示类似的部分,其中图1是示出根据本发明第一实施例的不确定本体推理设备100的内部结构的框 图;图2是示出图1所示不确定本体推理设备100的具体操作的流程图;图3是示出根据本发明第二实施例的不确定与不一致本体推理设备300的内部结 构的框图;图4是示出图3所示不确定与不一致本体推理设备300的具体操作的流程图;以
6及图5是被用于实现本发明的计算机系统的示意性框图。
具体实施例方式首先,本发明提供了一种针对不确定本体的推理方法与设备,根据该方法和设备 可以在不修改现有本体的基础上,针对用户提出的查询,得到尽可能正确的推理结果。同时 该推理结果包括了每一回答的推理路径及其置信度,用户可得到更多有用的信息,并根据 置信度判断选取哪一个回答。另外,在上述不确定本体推理方法的基础上,本发明的改进实施例可以同时应对 不确定与不一致本体。具体而言,其查询结果检测装置可同时判断查询的“真”回答和“假” 回答,从而得到不一致本体的所有查询结果,根据置信度大小排序后的查询结果为用户进 行选择提供了更多方便。为了便于说明,以下首先对本发明中所使用的术语进行简要介绍。不确定的本体所谓“不确定的本体”指的是本体的正确性不是固定的,而是具有
一定概率。不一致的本体所谓“不一致的本体”指的是该本体中存在错误或冲突(矛盾),从 而导致本体中的某些概念不能被正确解释。虽然本体的不一致是用户不希望看到的,但是 其存在往往难以避免。不可满足的概念所谓“不可满足的概念”表示该概念在本体中不存在合理解释。 每个概念都有一个解释函数,而对于“不可满足的概念”,其解释函数为空。可信因子本发明所定义“可信因子”(CF)用于表征本体及其包含元素(例如概 念、公理、实例、关系等)的不确定性。可信因子可以表示为一种得分,用于指示本体中元素 的正确性的可信程度。CF值越高,则表示该元素正确的概率越高。CF值可以在专家建立本 体时根据专家建议获得,或者利用某些预定算法来计算。例如,CF可以被表示为0和1之 间的数字,即被表示为CF:N— W,l],其中N表示本体中所有可能元素的集合。直接相关给定本体中的两个元素O和叫,如果在O和叫中同时出现一个相同 的名称(如实例名、概念名、关系名称等),则称O和▽直接相关。K相关给定本体中的两个元素①和①’,如果存在一组元素W0,...,WkG0并 且①和W0直接相关,W0和w 1直接相关,...,Wk和①,直接相关,则称①和①,K相 关,或者O和O’的相关度为K。查询一个本体E的查询 可以表示为对本体中某些概念、实例、关系、公理的描 述。查询一般有两种回答如果从E可以推理出 ,则回答“真”,说明该查询语句是成立 的,表示为2|=炉洳果从E可以推理出小不成立,则回答“假”,表示为2|=,p。推理路径推理路径表示为一个集合R,该集合记录了能够推理出查询 所需的 所有本体元素,即如果删除集合R的任意元素,则不能得到查询 的回答。表示为炉 且回答的置信度(Certainty degree of the answer, CDA)置信度可以表示为一种 得分,用于指示本体中某个查询的回答的可信程度。置信度分值越高,该回答正确的概率越 大。例如,CDA可以被表示为0和1之间的数字,即被表示为CDA:A— W,l],其中A表示查询所有回答的集合。下面将参考附图来具体描述根据本发明第一和第二实施例的针对不确定和不一 致本体的推理方法和设备。<第一实施例>首先,图1是示出根据本发明第一实施例的不确定本体推理设备100的内部结构 的框图,图2是示出图1所示不确定本体推理设备100的具体操作的流程图。如图1所示,根据该实施例,不确定本体推理设备100可以包括本体输入装置101、 概率扩展装置102、递增选择装置103、查询结果检测装置104、推理路径记录装置105、置信 度计算装置106、查询输入装置107和输出装置108。另外,图1还示出了相关存储设备,即 本体存储器109、概率本体存储器110、查询存储器111以及用于存储查询结果、相应推理路 径以及结果置信度的存储器112。下面将参考图2来具体描述图1所示不确定本体推理设备100的操作。首先,在 步骤201中,本体输入装置101和查询输入装置107可以分别从本体存储器109和查询存 储器111输入用于推理的本体B以及感兴趣的查询Φ,即需要判断从B能否得到Φ的查询 结果I=炉?其中本体B包含概念、实例、公理、关系等,表示为Β= (Τ,Α),其中T= {Φ,, i = 1,2,..,η},Α = {Cj, j = 1,2,..,m},其中T表示公理集,A表示断言集,Φ表示公理, c表示概念。在步骤202中,概率扩展装置102可以对通过本体输入装置101输入的本体B进行 概率扩展,以得到概率扩展本体B*。该概率扩展本体B*可以被存储在概率本体存储器110 中。所谓概率扩展就是给本体中的每个元素赋予一个概率值,以用于表示该元素的可信程 度,记作可信因子(CF)。表示为Β= (Τ, A) - B* = (TW)。其中B*表示概率本体,它包 含概念、实例、公理、关系等。 "表示概率公理集,T*= {(Φρ ai),i = l,2,..,n}。A*表 示概率断言集,A* = {(cj; α」),j = l,2,..,m}。α表示可信因子。关于可信因子的计算 方法,可以使用本领域中的任何公知技术,例如可以采用对比文献1中所描述的方法。鉴于 可信因子的计算方法不是本发明所关注的重点,这里不对此进行赘述。接下来,在涉及步骤203-210的循环过程中,递增选择装置103、查询结果检测装 置104、推理路径记录装置105和置信度计算装置106将根据从概率本体存储器110输入的 概率本体B*和用户给定的查询Φ,来计算查询结果、推理路径以及回答的置信度。首先,递增选择装置103通过一个选择函数来递增地选择与查询Φ相关度为k的 元素。选择函数s可以利用句法相似度对查询语句“Σ|=ρ ,,加以扩展。乂工,外幻包含 三个参数,第一个Σ表示所有供选择的元素集合;Φ表示初始查询;k表示相关度,初始值 为1,每递增选择一次相关度加一。在步骤203中,首先定义初始选择函数为查询语句Φ,即k= 1时彳(Σ, Ζ>,0) =炉。当k= 1时,选择函数选择Σ中与查询Φ直接相关的元素作为工作集合(步骤 204),并利用查询结果检测装置104来检测这一集合能否得出查询结果。具体而言,在步骤 205中,查询结果检测装置104首先判断集合Σ ‘能否得到查询Φ的“真”回答,即判断Φ 是否为真。如果可以(步骤205中的“是”),则在步骤207中,可以直接利用推理路径记录 装置105和置信度计算装置106来计算并记录该回答的推理路径与置信度。推理路径包 含能够推出该回答所需要的本体中的元素(如公理、实例等),去掉任何元素都不能得到该
8推理结果。置信度的计算方法例如可以将推理路径中所有元素的可信因子(CF)的值相乘。 相反,如果在步骤205中不能得到“真”回答,查询结果检测装置104则进而判断集合Σ ‘ 能否得到查询Φ的“假”回答(步骤206),S卩如果能够推断出与Φ相反的结论,则判断Φ 为假。如果在步骤206中可以判断出Φ为假,则推理路径记录装置105和置信度计算装置 106可以计算并记录该回答的推理路径与置信度(步骤207)。计算方法与前述相同。在步骤208中,判断针对查询Φ是否有回答,如果有(或者为“真”回答或者为 “假”回答),在步骤211中,输出装置108则可以输出分别由查询结果检测装置104、推理路 径记录装置105和置信度计算装置106得到的查询结果、每个结果的推理路径以及相应的 置信度。如果没有(步骤208中的“否”),即现有元素集合不足以作出判断,则转到下一步 骤 209。在步骤209中,判断集合Σ ‘是否等于本体B*(说明现有集合已经选取了本体中 的所有元素,因此没有新的元素可以加入)或者集合Σ ‘是否等于Σ (说明本轮选择函数 没有选择新的元素加入,即不再有与Σ ‘相关的元素)。如果判断条件成立,则在步骤212 中输出“没有结果”,即根据本体B不能对查询Φ作出判断。如果条件不成立,则转到步骤 210。在步骤210中,递增选择装置103将k值加1,即使得选择函数的相关度加1,并将集 合Σ'赋予Σ。然后,过程返回步骤204,继续循环,直到找到相关的查询结果或作出“没有 结果”的判断。为了更好地说明本发明第一实施例的原理,下面给出一具体示例。例如已有本体万= {A^B,AczC,C<zB,DczE,E(zB, A{a)},经过概率扩展
装置102之后得到概率本体B*为
B* = {{A c B, 0.7), (A c C, 0.8), (C c B, 0.6), (D c E, 0.8), (E [ B, 0.4), ⑷,0.5)}。再假设输入查询Φ为“概念A包含于B吗? j C 5 ”。根据图2所示算法,首先选择函数初始化为k= 1,Σ = <5*,叭0) 二炉={dc5}。然后,计算元素集合
Σ‘ = φ, 1) = {(A c B, 0.7),(A cz C, 0.8),(C c B, 0.6), (Ε α B, 0.4),(A(a), 0.5)},也即选择所有与概念A、B直接相关的本体元素。判断是否可由集合Σ'推理出查询Φ,即是否存在“真”回答Σ'|=识?根据推理,发现有两条推理路径都可以得到回答为“真”,记录这两条推理路径并
计算其置信度。然后,判断是否有回答。由于结果为“是”,因此可以输出查询结果为查询结果Α={{回答1:真,路径从O.7)丨,0.7},{回答2 真,路径
{C4〔C,0.8),(CC5,0.6)},0.48H。其中,因为回答1的推理路径只包含一条公理,所以其
置信度等于该公理的可信因子0. 7 ;对于回答2,其推理路径报告2条公理,其置信度等于2 条公理的可信因子的乘积,即0. 8X0. 6 = 0. 48由于这一计算过程能够更有效更快速地得到结果,而且查询结果反映了具体的推 理路径及其置信度,因此用户能够得到更多的有用信息,并根据置信度选择更可信的回答。
<第二实施例>图3是示出根据本发明第二实施例的不确定与不一致本体推理设备300的内部结 构的框图,图4是示出图3所示不确定与不一致本体推理设备300的具体操作的流程图。与 第一实施例相比,第二实施例的区别在于其提供了可针对不确定与不一致本体的推理方法 与设备。由于现实中的本体大多是既不确定又不一致的,并且由本体的不确定性也常常带 来不一致的问题,因此有必要提出一种推理方法,对于输入的查询,即使对于不确定和不一 致的本体,也能得到尽可能合理的回答。根据第二实施例,本发明的方法不需要修改原始本体,在保留不确定性与不一致 性的情况下给出所有的“真”和“假”回答,以及每个回答的推理路径及其置信度。用户可 以选择置信度最大的回答,也可以根据查询结果的集合选择其认为最适合的回答。在第二实施例中仍然使用第一实施例所采用的选择函数来搜索与查询相关的本 体元素。由于本体的不一致性,可能同时存在“真”和“假”回答,因此系统需要记录每个回 答并计算他们的置信度。最后,通过将所有回答根据置信度从大到小排序,可以得到最可信 的回答。如图3所示,类似于第一实施例,不确定与不一致本体推理设备300也包括本体输 入装置101、概率扩展装置102、递增选择装置103、查询结果检测装置104、推理路径记录装 置105、置信度计算装置106、查询输入装置107和输出装置108。不同于第一实施例,不确 定与不一致本体推理设备300还包括查询结果记录装置301和查询结果排序装置302。下面将参考图4来详细描述图3所示不确定与不一致本体推理设备300的操作过 程。首先,在步骤401中,类似于第一实施例,本体输入装置101和查询输入装置107 可以分别从本体存储器109和查询存储器111输入用于推理的本体B以及感兴趣的查询 Φ。在步骤402中,概率扩展装置102可以对通过本体输入装置101输入的本体B进行概 率扩展,以得到概率扩展本体『。该概率扩展本体『可以被存储在概率本体存储器110中。在步骤403中,递增选择装置103初始化k等于1,k用于选择函数相关度的递 增计数。初始化选择函数s为查询Φ,并将该集合赋予Σ,即Σ = ^CSiii,叭0)=炉。然 后,在步骤404中,通过选择函数s计算与查询Φ相关度为k的元素集合,记为Σ',即 Z' = s(B*, φ , k) ο接下来,在步骤405中,查询结果检测装置104判断集合Σ ‘能否得到查询Φ的 “真”回答,即判断Φ是否为真。如果可以(步骤405中的“是”),推理路径记录装置105 和置信度计算装置106则分别计算出该回答的推理路径与置信度,并且查询结果记录装置 301将该回答记录到结果集合A中,表示为{回答ID:真,路径{...},置信度}...(步骤 406)。如果不能得到“真”回答,则转到下一步骤407。在步骤407中,查询结果检测装置104继续判断集合Σ ‘能否得到查询Φ的“假” 回答,即如果能够推断出与Φ相反的结论,则判断Φ为假。同样地,如果可以判断Φ为 假,推理路径记录装置105和置信度计算装置106则分别计算出该回答的推理路径与置信 度,并且查询结果记录装置301将该回答同样记录到结果集合A中,表示为{回答ID 假, 路径{···},置信度}...(步骤408)。如果不能,则转到下一步骤409。
在步骤409中,判断集合Σ ‘是否等于本体B*(说明现有元素集合已经选取了本 体中的所有元素,因此没有新的元素可以加入)或者集合Σ ‘是否等于Σ (说明本轮选择 函数没有选择新的元素加入,即不再有与Σ ‘相关的元素)。如果判断条件成立,则转到步 骤411。如果不成立,则转到步骤410。在步骤411中,判断针对查询Φ是否有回答,即查询结果记录装置301是否记录 有任何关于查询Φ的回答。如果有(可能同时包含“真”和“假”),则转到步骤413。如果 没有,则在步骤412中输出“没有结果”,即根据本体B不能对查询Φ作出判断。在步骤410中,当在步骤409的判断条件不成立的情况下,递增选择装置103将k 值加1,即表示相关度加1,并将集合Σ ‘赋予Σ。然后,过程返回步骤404,继续循环。在步骤413中,查询结果排序装置302对查询结果记录装置301所记录的所有查 询结果(可能同时包含“真”和“假”回答)进行排序,默认排序方式是根据置信度从大到 小。然后,在步骤414中,输出装置108输出排序后的查询结果、每个结果对应的推理路径 与置信度。为了更好地说明本发明第二实施例的原理,下面给出一具体示例。 例如已有本体万= {C^B~D(ZE,E^B,GcHr,’经过概率扩展装置得到概念本体B*为 假设输入查询Φ为“概念A包含于B吗? 乂 c万? ”。根据图4 所示算法,初始化 k = 1,Σ =0) = ρ = {乂 c 5}。之后计算元素集合
G万,0.7),04cC,0.8),(Xe= Da0,0.9),μ⑷,0.5)) ^n、牛拟 _8] Σ(化 G,0.3)’(Cc5,0·6),(五〔尾0.7),讲d,0.6) }也即选择
所有与概念A、B直接相关的本体元素。判断是否可由集合Σ'推出查询Φ为真,S卩Σ’|=识?根据推理,发现有两条推理路径可以得到回答为“真”,记录这两条推理路径并计 算其置信度为回答集合A= {{回答1 真,路径丨^4;5…·7)丨,0.7},{回答2:真,路径 |(^CC,0.8),(CC5,0.6)|90 48}}。判断是否可由集合Σ'推出查询Φ为假,即Σ’|="^ ,经判断不能得到。继续判断是否满足Σ'等于B*或者Σ'等于Σ,发现两者均不满足,于是k值加 1,变为k = 2,同时将集合Σ'赋给Σ。此时,选择函数再次选择元素集合, 判断是否可由集合Σ'推出查询Φ为真,即Σ'|=炉?。根据推理,发现又有一条推理路径可以得到回答为“真”,将其加入回答集合为回答集合A = {{回答 1 真,路径{(乂。5,0.7)}, 0.7},{回 答 2:真,路径{ 04 C= C,0.8),(C C5,0.6) }, 0· 48},{回答 3:真,路径 ^(AczDnQ, 0.9), (D c E, 0.8), (E cz B, 0.7)}, 5}}。判断是否可由集合Σ ‘推出查询Φ为假,即沪?。据推理得到一条推理路径,计算其置信度并将其加入回答集合Α,表示为{回答 4 假,路径{(万 S G,0.3),(G a HnK,0.5),(H cz A,0.6) 0. 09}。判断是否满足Σ'等于B*或者Σ'等于Σ。发现前者满足,即当前工作集合已经 包含所有的本体元素,于是继续判断是否有回答。由于回答集合中“有”回答,因此对所有 查询结果进行排序。通过根据置信度大小进行排序,从而得到的最终输出结果为查询结果A = {{回答1 真,路径丨^4。5,0.7)丨,0.7},{回 答 3 真,路径{ ^ D ο 0,0.9), φ C= Ε, 0.8), (Ε e B, 0.7) }, 0· 5丨,{回
答 2:真,路径{ μ C= C, 0.8), (C C= 0.6) },0.48},{回答 4:假,路径 |(5cG,0.3),(Ga Hr^K,0.5),(H ^ A,0.6)},0. 09}}。以上分别参考图1、图2、图3和图4详细描述了根据本发明第一和第二实施例的 本体推理设备及其操作原理。图5是被用于实现本发明的计算机系统的示意性框图。如图5所示,该计算机系统500包括CPU 501、用户接口 502、外围设备503、存储器 505、永久存储设备506以及将它们彼此相连的总线504。存储器505中包含语义web应用 5051、本体推理模块5052、本体编辑应用5053、本体学习应用5054、其他应用5055和操作 系统(0S)5056等等。本发明的核心功能主要与本体推理模块5052相关,其例如是图1或 图3所示的不确定本体推理设备100或不确定与不一致本体推理设备300。存储器505中 的各个应用可以并行运行,以提供多种不同的功能。永久存储设备506可以包含本发明所 涉及的各种存储器,例如本体存储器、概念本体存储器、查询存储器、查询结果/推理路径/ 置信度存储器等等。根据上述描述可以看出,本发明具有以下效果根据本发明,能够针对不确定和不一致本体得到尽可能正确的查询结果。这使得 用户不需要花费较大代价修改本体。并且,本发明的推理方案采用了递增选择函数,该函数能选择与特定查询相关的 元素,从而能够最快地得到推理所需元素并得到查询结果。此外,该函数仅选取了与查询相 关的元素,不涉及不相关的元素,因此最大程度上避免了其他不确定、不一致元素的干扰。
利用本发明所得到的查询结果不仅包括对“真”、“假”回答的判断,而且包括具体 的推理路径以及每一回答对应的置信度。从而,用户能够得到更多有用信息,并可方便地根 据置信度大小选择最可信的查询结果。上面已经参考附图描述了根据本发明的具体实施例。但是,本发明并不限于图中 示出的特定配置和处理。并且,为了简明起见,这里省略对已知方法技术的详细描述。在上 述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所 描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神之后,作出各种改变、 修改和添加,或者改变步骤之间的顺序。本发明的元素可以实现为硬件、软件、固件或者它们的组合,并且可以用在它们的 系统、子系统、部件或者子部件中。当以软件方式实现时,本发明的元素是被用于执行所需 任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携 带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输 信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦 除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由 诸如因特网、内联网等的计算机网络被下载。本发明可以以其他的具体形式实现,而不脱离其精神和本质特征。例如,特定实施 例中所描述的算法可以被修改,而系统体系结构并不脱离本发明的基本精神。因此,当前的 实施例在所有方面都被看作是示例性的而非限定性的,本发明的范围由所附权利要求而非 上述描述定义,并且,落入权利要求的含义和等同物的范围内的全部改变从而都被包括在 本发明的范围之中。
权利要求
一种本体推理方法,包括a.输入本体与查询;b.利用选择函数选择所述本体中与所述查询相关的元素集合;c.检测利用所选元素集合能否推理出查询结果;以及d.如果不能推理出任何查询结果,则递增所述选择函数的相关度并重复上述步骤b和c,如果能够推理出查询结果,则输出所述查询结果和相应推理路径。
2.如权利要求1所述的方法,还包括对所述本体进行概率扩展,以对所述本体中的每个元素计算一个可信因子值;以及 对于每个所述查询结果,利用相应推理路径所包含元素的可信因子值计算该查询结果的置信度。
3.如权利要求2所述的方法,其中计算所述查询结果的置信度包括计算相应推理路径 所包含元素的可信因子值的乘积。
4.如权利要求1所述的方法,其中所述查询结果是“真”回答或“假”回答。
5.如权利要求1所述的方法,其中所述元素包括概念、公理、实例和关系。
6. 一种本体推理方法,包括a.输入本体与查询;b.利用选择函数选择所述本体中与所述查询相关的元素集合;c.检测利用所选元素集合能否推理出查询结果;d.如果不能推理出任何查询结果,则递增所述选择函数的相关度并重复上述步骤b和 C,如果能够推理出查询结果,则记录所述查询结果和相应推理路径,并递增所述选择函数 的相关度并重复上述步骤b和C ;以及e.当所选元素集合已经包含所述本体的所有元素或者所述选择函数无法再选出与所 述查询相关的元素时,输出所记录的所述查询结果和相应推理路径。
7.如权利要求6所述的方法,还包括对所述本体进行概率扩展,以对所述本体中的每个元素计算一个可信因子值; 对于每个所述查询结果,利用相应推理路径所包含元素的可信因子值计算该查询结果 的置信度;以及按照置信度的大小,对所记录的所有查询结果进行排序。
8.如权利要求6所述的方法,其中所述查询结果包括“真”回答和“假”回答。
9. 一种本体推理设备,包括 本体输入装置,用于输入本体; 查询输入装置,用于输入查询;递增选择装置,用于利用选择函数选择所输入的本体中与所述查询相关的元素集合; 查询结果检测装置,用于检测利用所述递增选择装置所选的元素集合能否推理出查询结果;推理路径记录装置,用于在所述查询结果检测装置确定能够推理出查询结果的情况 下,记录与所述查询结果相对应的推理路径;以及输出装置,用于输出推理出的所述查询结果和相应的推理路径, 其中,在所述查询结果检测装置确定利用所述递增选择装置所选的元素集合不能推理出任何查询结果的情况下,所述递增选择装置递增所述选择函数的相关度以更新所述元 素集合,并且所述查询结果检测装置基于更新后的元素集合进一步检测能否推理出查询结^ ο
10.如权利要求9所述的设备,还包括概率扩展装置,用于对所述本体进行概率扩展,以对所述本体中的每个元素计算一个 可信因子值;以及置信度计算装置,用于对于每个所述查询结果,利用相应推理路径所包含元素的可信 因子值计算该查询结果的置信度,其中所述输出装置输出所述查询结果的置信度。
11.一种本体推理设备,包括 本体输入装置,用于输入本体; 查询输入装置,用于输入查询;递增选择装置,用于利用选择函数选择所输入的本体中与所述查询相关的元素集合; 查询结果检测装置,用于检测利用所述递增选择装置所选的元素集合能否推理出查询结果;查询结果记录装置,用于在所述查询结果检测装置确定能够推理出查询结果的情况 下,记录所述查询结果;推理路径记录装置,用于记录与所述查询结果相对应的推理路径;以及 输出装置,用于输出所记录的所有查询结果和相应推理路径,其中,无论所述查询结果检测装置确定能否推理出查询结果,所述递增选择装置都要 递增所述选择函数的相关度以更新所述元素集合,并且所述查询结果检测装置基于更新后 的元素集合进一步检测能否推理出查询结果,直到当所选元素集合已经包含所述本体的所 有元素或者所述选择函数无法再选出与所述查询相关的元素时,所述输出装置输出所记录 的所述查询结果和相应推理路径。
12.如权利要求11所述的设备,还包括概率扩展装置,用于对所述本体进行概率扩展,以对所述本体中的每个元素计算一个 可信因子值;置信度计算装置,用于对于每个所述查询结果,利用相应推理路径所包含元素的可信 因子值计算该查询结果的置信度;以及查询结果排序装置,用于按照置信度的大小,对所记录的所有查询结果进行排序, 其中所述输出装置输出经排序的查询结果、相应的推理路径以及相应的置信度。
全文摘要
本发明提供了与特定查询相关的不一致和不确定本体的推理方法和设备。根据本发明的本体推理方法可以包括如下步骤a.输入本体与查询;b.利用选择函数选择本体中与查询相关的元素集合;c.检测利用所选元素集合能否推理出查询结果;以及d.如果不能推理出任何查询结果,则递增所述选择函数的相关度并重复上述步骤b和c,如果能够推理出查询结果,则输出查询结果和相应推理路径。在一个实施例中,本发明的方法还可以根据本体元素的可信因子计算各个查询结果的置信度。根据本发明,用户无需修改原始本体就能够针对不确定和不一致本体得到尽可能正确的查询结果。
文档编号G06N5/04GK101930437SQ20091014632
公开日2010年12月29日 申请日期2009年6月19日 优先权日2009年6月19日
发明者刘博 , 李建强, 赵彧 申请人:日电(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1