一种知识的检索方法_2

文档序号:9200412阅读:来源:国知局
作用空心液压千斤顶,单作用液压千斤顶,液压千斤顶(用Y表示)},并按概念的权值由 高到低的顺序进行排序。
[0044] 3-2利用本体映射概念将用户概念集A映射为过渡概念集a,再整理后得本体概念 集B,分析相应的本体概念得本体概念集B = (B1, B2, B3, B4, B5} = {JSAH-606, JSAH系列, 单作用,空心,Y},映射后相对应的概念的权值不变。
[0045] 表2液压千斤顶部分用户概念和过渡概念映射关系表
[0046]
[0047] 3-3将B中的每一个概念Bi按权值的高低进行语义相似度计算,根据基于语义距 离的相似度计算式可知:
[0048]
[0049]
[0050] 类似可计算出
[0051] SinKB1, B3) =0· 200, SinKB1, B4) =0· 116, SinKB1, B5) =0· 075,
[0052] Sim (B2, B3) =0· 656, Sim (B2, B4) =0· 187, Sim (B2, B5) =0· 104,
[0053] Sim (B3, B4) =0· 625, Sim (B3, B5) =0· 167, Sim (B4, B5) =0· 375。
[0054] 计算结果根据在知识本体中语义相似度Sim(Ci,ck)彡λ (λ为相似度阈值) 的概念来判断,那么此处设定λ的为0.65,因此可得到新的检索需求概念空间,所得的 结果组成一个本体核心概念集C = IC1, C2, C3} = {JSAH-606, JSAH系列("JSAH-120", " JSAH-121"," JSAH-123 "," JSAH-202 "," JSAH-206 "," JSAH-302 "," JSAH-306 "," JSAH-603 ", "JSAH-1003"),单作用}。
[0055] 3-4将本体核心概念集C与知识库进行相应的相似度计算,主要根据属性特征来 计算他们的相似度,根据基于属性的相似度计算式可知,
[0056]
[0057]
[0058]
[0059] 类似可计算出
[0060] Sim (C2, JSAH-606) = 0. 8
[0061] Sim (C2, RCH-120) = 0. 5
[0062] Sim (C3, JSAH-606) = 0. 8
[0063] 计算结果根据相似度Sim(Cj,Cl)彡θ (Θ为相似度阈值)的概念来判断,那么 此处设定Θ的为0.6,因此可得到新的检索需求概念空间,所得的结果组成一个本体核心 概念集 D= (DpD2I = {JSAH-606, JSAH 系列("JSAH-120","JSAH-121","JSAH-123", " JSAH-202"," JSAH-206"," JSAH-302"," JSAH-306"," JSAH-603"," JSAH-1003")}。
[0064] 3-5对得出的知识解集D进行相应的条件判定,有得到的结果可知知识解集D不为 空集,那么不需要返还到B处重新求解,可以直接进行下一步整体相似度的求解。
[0065] 3-6根据得到的结果综合计算用户概念集A和知识集D的整体相似度,根据整体相 似度计算式可知,
[0066] Sim(A11D1) = a XSinKB1, Β) + β XSinKC1, JSAH-606) = 1
[0067] Sim(A11D2) = a XSim(B1, Β2) + β XSim(C2,JSAH-606) = 0.828
[0068] Sim(A2lD1) = α XSim(B1, Β2) + β XSinKC1, JSAH-606) = 0.928
[0069] Sim(A3,D2) = α XSim(B11B3) + ^ XSim(C2, JSAH-606) = 0· 313
[0070] 3-7根据相似度所求得的值将得到的知识解集D里的解由大到小的排列如 下:"JSAH-606"的JSAH系列单作用空心液压千斤顶,JSAH系列单作用空心液压千斤 顶(" JSAH-120"," JSAH-121"," JSAH-123"," JSAH-202"," JSAH-206"," JSAH-302", "JSAH-306","JSAH-603","JSAH-1003"),因此,通过本检索算法是可以得出检索所需的解。
【主权项】
1. 一种知识的检索方法,该检索方法基于的检索模型分为三个层次:人机交互层、资 源层和检索匹配层,在检索过程中需要本体库的支撑; 所述的人机交互层主要实现用户与计算机之间的语言交流;用户输入需要查询的内 容到用户界面上,计算机发出检索请求;用户的检索请求多种多样,为了使计算机能够准确 识别,需要根据本体库的知识分析用户的真实检索意图,进而使检索请求标准化,进一步转 向检索匹配层进行检索请求的预处理;人机交互层面上还有一个功能就是对检索结果的处 理,合成用户所需要的检索结果; 所述资源层主要是收集知识源;通过本体库中的相关知识对收集的知识有一个语义上 的分析和标注,因此可以建立相应的索引信息放入索引库内,并且已标注的知识能够补充 和完善本体库;在模型中运行过程是将本体库中的相关知识应用到检索请求分析和检索请 求预处理,对检索内容的语义标注和检索内容的语义扩展,对检索内容和索引库的匹配,以 及对检索结果的排序、再处理和合成; 所述检索匹配层是整个检索流程的关键;首先对检索请求进行预处理,使检索请求信 息规范化和标准化;然后通过本体知识对检索内容进行语义标注,使计算机能够充分识别 检索内容,并且在本体知识的作用下对已标注的语句进行语义上同义词或近义词的扩展; 进而根据本体库中的相关知识对检索内容进行相应的语法匹配和语义匹配;最后根据相关 程度对检索结果进行排序处理,将检索结果呈现给用户; 其特征在于该方法包括以下步骤: 步骤1.用户输入所需要检索的请求,系统提取检索请求概念,并将这些概念设定为一 个用户概念集,定义这个用户概念集为A,其中A= {ApA2,A3,…,An},并按概念的权值由 高到低的顺序进行排序; 步骤2.利用本体映射概念将用户概念集A映射为过渡概念集a= {ai,a2,a3,…,an},其映射关系如下表所示,并将过渡概念集a整理后得到对应的本体概念集B={BpB2, B3,…,Bn},整理得到的映射后相对应的概念的权值不变;步骤3.将本体概念集B中的每一个概念&按权值的高低进行语义相似度计算,计算 在知识本体中语义相似度Sim(Ci,ck)彡A(i,kG(l,n),A为相似度阈值)的概念,其中 得到新的检索需求概念空间,把它称为本体核心概念集,记为C=IA,C2,C3,…,CK},其中 (l,k) G (l,n); 其中的基于语义距离相似度Sim(Ci,ck)计算公式为:其中,dl(Ci)和dl(ck)分别是概念Ci、ck在领域本体中所处的层次;Dist(ci,ck)是本 体树型中概念Ci、ck之间的最小路径;maxdl是指本体树型中深度最大值;w是一个权值, w^0; 步骤4.将本体核心概念集C与知识库进行语义匹配,进行基于属性相似度计算,计算 相似度Sim(Cj,Cl)彡0(j,lG(l,k),0为相似度阈值)的概念,得到知识解集D,记D= {Di,D2,D3,…,DJ,其中(l,i)G(l,k); 其中的基于属性相似度Sim(q,ck)计算公式为:其中,Attr(Cj)和Attr(c)分别表示概念Cj、Ci的属性集,Attr(c』)flAttr(c)表示 两概念集具有相同属性的集合,Attr(Cj)UAttrf^)表示两概念所有属性的集合,CountO 表示相应集合中属性的数量; 步骤5.对得出的知识解集进行相应的条件判定,如果不为空集,那么再计算用户概念 集B和知识解集D的综合相似度;如果为空集,那么就重新回到本体映射概念,并且增大相 似度的范围,使得可能性更大;根据整体相似度的计算结果大小将匹配成功的知识从高到 低依次排列出来,并呈现在系统界面上; 其中综合相似度Sim(cx,cy)计算公式为: Sim(cx, cy) = a X81111(0^ ck) + 0 XSim(Cj, cx) 其中,相似度Sim(Ci,ck)和Sim(4Cl)分别代表基于语义相似度值和基于属性相似度 值;a和|3是相似度权重,a+|3 =1,概念集范围X,yG(1,i)。
【专利摘要】本发明公开了一种知识的检索方法。本发明认为检索的匹配性高必须较全面表达知识的结构和语义,综合语义距离和语义属性计算相似性,为此,提出了基于本体的知识表示流程和基于本体的知识检索模型以及算法。本发明通过将提出的基于本体的检索算法配合应用在所提出的检索模型中,针对概念的语义距离和概念属性进行相似性计算,使得出的结果更加接近用户需求,挺高了检索的效率和知识的重用。
【IPC分类】G06F17/30
【公开号】CN104915396
【申请号】CN201510284563
【发明人】苏少辉, 李鹏飞, 徐匡, 黄成毅, 曾垂远, 吴凡超
【申请人】杭州电子科技大学
【公开日】2015年9月16日
【申请日】2015年5月28日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1