一种农业领域概念相似度矩阵生成方法

文档序号:6555007阅读:394来源:国知局
专利名称:一种农业领域概念相似度矩阵生成方法
技术领域
本发明涉及农业语义网络与知识网格领域,公开了优化本体领域概念间的相似度矩阵的自动生成方法及系统。
背景技术
随着知识的爆炸式发展,知识的表达、共享与交换已成为知识管理系统中亟待解决的瓶颈。本体作为共享的明确规范化概念模型,使得上述问题的解决成为可能。特别是自语义Web提出以来,本体已日渐成为知识工程、知识管理、信息检索和语义Web等多个领域的重要组成部分,并成为人工智能和知识工程领域中一个重要的研究方向,在知识的获取、 表示、分析和应用等方面具有深远的意义。农业领域知识因其应用的广泛性,越来越受到相关学者的重视。农业信息资源因庞杂、分散、异构而呈现出相对孤立和难于满足用户对信息需求的状况,给农业知识的普及带来一定的难度。农业领域本体是一个包含农业术语、定义以及术语间规范关系说明的体系,是农业领域内信息、信息与信息间的相互关系的形式化表达。我国虽然十分重视农业信息与知识工程理论技术的研究,但是还存在农业知识的获取、发现与融聚等相对较困难的问题。因此,研究农业领域本体,建立一个真正意义上的基于本体的共享农业知识库,是促进数字化农业快速发展的有效途径。随着对领域本体研究与应用的增多,大多数领域本体研究组织面向不同的应用开发出不同的领域本体,本体间存在着较大的差异。尽管这些不尽相同的本体是对同一领域进行描述,但它们是对该领域不同层面的描述,因而不可避免地包含着具有重复的和不匹配的语义信息。主要表现在一方面,不同本体间缺少必要的联系,造成在同一领域内的本体多样性和冲突性,使得领域内本体间无法进行互操作,即本体异构;另一方面,数量众多的本体存在着不同层次的差异性,包括系统异构、语法异构以及语义异构。最终使得领域内本体间无法进行互操作,大大制约了知识的利用效率。

发明内容
本发明利用概念格理论,将领域本体信息源转变为形式背景,构建基于多层次关系的领域形式背景知识库,优化并改进概念相似度计算模型。为实现上述目的,本发明的技术方案提出了一种农业领域概念相似度矩阵生成方法,该方法包括以下步骤
51.基于领域本体提取领域形式背景的对象属性列表;
52.对所获取的领域形式背景进行单值化、满值化操作;
53.获取领域概念属性的权重信息,划分概念层次;
54.利用所述层次概念进行概念相似度计算模型的设计,获取领域概念对的相似度矩阵。所述步骤Sl具体包括511.将领域本体中“概念+属性”作为一对元素,利用本体解析工具包Jena,解析出概念、属性对,形成结果列表;
512.按照本体概念转化为背景对象,本体属性转化为背景属性的原则,获取领域形式背景的横维和纵维信息;
513.整理领域形式背景的对象-属性关系集,抽取出存在非规范化的关系集;
514.判断背景对象(属性)的子对象(属性)是否为空值,如果不是,则作为新的对象 (属性)加入对象(属性)列表并转向步骤S13,否则停止。所述步骤S2具体包括
521.对所形成的领域形式背景信息进行单值化转化,分解包含有多值信息属性列,简化领域背景的关系集;
此处多值属性背景由四元组(G,M,W,I)表示,其中G与M的含义与上述情况保持一致, W为具体的属性值,I是由G、M和W间的三元关系。采用概念缩放的方法,将具体的属性值转化为该概念的每个属性,用以解释相应的属性,其目的是将多元背景值转化为二元背景来表达,利用属性增加的手段来换取关系(对象与属性间的关系)的二元化;
522.约简背景关系集,消除其中的冗余信息,简化背景知识的表达;
在不改变原有知识分类能力的前提下,取出若干与原内容不相关或是关联程度不高的属性。将领域间存在依赖关系的关系族划分为非核心属性集和核心属性集。利用形式背景的相似属性集,获取简化后的形式背景相似属性矩阵;
523.将包含缺值信息的背景关系集,进行二元化转化,满值化领域背景;
着眼于缺值关系本身,从属性的角度,将其与对象的不确定性关系加以扩展,对缺值的属性按其在不同对象中的不同缺值分别进行扩充,最后得到完整的形式背景;
假设所有的缺值背景都建立在二元的前提下,那么该问题就转化成如何用一个二元的形式来表达一个三元关系。现将转化机理描述如下
若(属性I 1)值为1 表明该对象与属性a的二元关系为定值; 若(属性 1)值为0:
i)如果(属性h 1)与(属性I*)取值相反,表明该对象与属性a的二元关系为缺值; )如果(属性 1)与(属性 *)取值相同,表明该对象与属性a的二元关系为定值, 且其二元关系与i)中情况相反。所述步骤S3具体包括
531.获取该形式背景所生成的矩阵中对象的个数(对象的秩);
对于形式背景K= (G,M,I),任意的对象gee则由该形式背景所生成的矩阵中对象g 所在行具有mtx相应地表明该对象秩为m,记作r(g)=m ;类似地,任意概念的内涵的个数为n,则该概念的秩Ik为η;
532.获取领域背景的属性个数,划分概念层次;
令m=maX{ r(g) g e G,若背景的属性IM| >m,对于该背景所生成的所有概念划分为如下层次
1)初始层Ll的概念(G,0);
2)L2的概念秩为m的概念,所有的r (g) =m的概念均属于此层次;
3)L3的概念秩为m-1的概念,所有的r(g)=m-l的概念均属于此层次;4)L4的概念秩为m-2的概念,所有的r(g)=m-2的概念均属于此层次;
5)依次计算直到某概念的外延为空时,则(0,M)
533.划分不同层次的节点属性并计算其相应的权值信息;
534.通过对概念的秩进行定义和概念对并运算的封闭特征,生成具有层次结构的形式概念。所述步骤S4体包括
541.初始化蕴含概念的载体(形式背景),根据对象与属性间的关系将其0、1化;
542.计算概念对共有的属性特征,并作加和;
543.统计上述概念对间属性的总和,作加和;
544.给出综合的领域本体概念相似度计算模型;
权利要求
1.一种农业领域概念相似度矩阵生成方法,该方法包括以下步骤51.基于领域本体提取领域形式背景的对象属性列表;52.对所获取的领域形式背景进行单值化、满值化操作;53.获取领域概念属性的权重信息,划分概念层次;54.利用所述层次概念进行概念相似度计算模型的设计,获取领域概念对的相似度矩阵。
2.如权利要求1所述的一种农业领域概念相似度矩阵生成方法,其特征在于所述步骤Sl具体包括511.将领域本体中“概念+属性”作为一对元素,利用本体解析工具包Jena,解析出概念、属性对,形成结果列表;512.按照本体概念转化为背景对象,本体属性转化为背景属性的原则,获取领域形式背景的横维和纵维信息;513.整理领域形式背景的对象-属性关系集,抽取出存在非规范化的关系集;514.判断背景对象(属性)的子对象(属性)是否为空值,如果不是,则作为新的对象 (属性)加入对象(属性)列表并转向步骤S13,否则停止。
3.如权利要求1所述的一种农业领域概念相似度矩阵生成方法,其特征在于所述步骤S2具体包括·521.对所形成的领域形式背景信息进行单值化转化,分解包含有多值信息属性列,简化领域背景的关系集;此处多值属性背景由四元组(G,M,W,I)表示,其中G与M的含义与上述情况保持一致, W为具体的属性值,I是由G、M和W间的三元关系;采用概念缩放的方法,将具体的属性值转化为该概念的每个属性,用以解释相应的属性,其目的是将多元背景值转化为二元背景来表达,利用属性增加的手段来换取关系(对象与属性间的关系)的二元化;·522.约简背景关系集,消除其中的冗余信息,简化背景知识的表达;在不改变原有知识分类能力的前提下,取出若干与原内容不相关或是关联程度不高的属性;将领域间存在依赖关系的关系族划分为非核心属性集和核心属性集;利用形式背景的相似属性集,获取简化后的形式背景相似属性矩阵;·523.将包含缺值信息的背景关系集,进行二元化转化,满值化领域背景;着眼于缺值关系本身,从属性的角度,将其与对象的不确定性关系加以扩展,对缺值的属性按其在不同对象中的不同缺值分别进行扩充,最后得到完整的形式背景;假设所有的缺值背景都建立在二元的前提下,那么该问题就转化成如何用一个二元的形式来表达一个三元关系;现将转化机理描述如下若(属性I 1)值为1 表明该对象与属性a的二元关系为定值;若(属性 1)值为0:i)如果(属性h 1)与(属性I*)取值相反,表明该对象与属性a的二元关系为缺值; )如果(属性 1)与(属性 *)取值相同,表明该对象与属性a的二元关系为定值,且其二元关系与i)中情况相反。
4.如权利要求1所述的一种农业领域概念相似度矩阵生成方法,其特征在于所述步骤S3具体包括531.获取该形式背景所生成的矩阵中对象的个数(对象的秩);对于形式背景K= (G,M,I),任意的对象ge G,则由该形式背景所生成的矩阵中对象g 所在行具有m个X,相应地表明该对象秩为m,记作r (g) =m ;类似地,任意概念的内涵的个数为n,则该概念的秩也为η;532.获取领域背景的属性个数,划分概念层次;令m=maX{ r(g) g e G,若背景的属性IM| >m,对于该背景所生成的所有概念划分为如下层次1)初始层Ll的概念(G,0);2)L2的概念秩为m的概念,所有的r (g) =m的概念均属于此层次;3)L3的概念秩为m-1的概念,所有的r(g)=m-l的概念均属于此层次;4)L4的概念秩为m-2的概念,所有的r(g)=m-2的概念均属于此层次;5)依次计算直到某概念的外延为空时,则(0,M)533.划分不同层次的节点属性并计算其相应的权值信息;534.通过对概念的秩进行定义和概念对并运算的封闭特征,生成具有层次结构的形式概念。
5.如权利要求1所述的一种农业领域概念相似度矩阵生成方法,其特征在于所述步骤S4具体包括541.初始化蕴含概念的载体(形式背景),根据对象与属性间的关系将其0、1化;542.计算概念对共有的属性特征,并作加和;543.统计上述概念对间属性的总和,作加和;544.给出综合的领域本体概念相似度计算模型;其中Xi=fi(Bl_fl B2_),表示两者在粗糙概念格第i层的共有属性特征,Yi= fi(Bl_n B2_)+ fi(Bl_ - B2_)+ f i (B2_ - Bl_),表示在粗糙概念格第i层两个概念具有的属性特征;Wi为该概念元素所在层的权值,由文献[4]思想(可以适当扩展变成自己的东西),不同层次间定义的权值为l/2i_l,其中i为此概念所在层数;Al_粗糙形式概念(Al, Bi)的下近似概念(A1_,B1_)的对象;A2_粗糙形式概念(A2,B2)的下近似概念(A2_,B2_) 的对象;Bl_粗糙形式概念(Al,Bi)的下近似概仓(Al_, BlJ的属性;B2_粗糙形式概念 (A2,B2)的下近似概念(A2_,B2_)的属性;参数α是权重因子,用以调节该模型的准确性。
全文摘要
本发明涉及一种农业领域概念相似度矩阵生成方法,针对农业领域本体概念间相似度加以研究,提出一种基于概念格理论的农业领域本体概念相似矩阵提取建模方法,该方法包括四个步骤包括S1领域形式背景提取,S2领域概念满值化及S3属性权重提取和S4基于概念格的领域相似度模型计算集成等。本发明可以有效的提高农业领域本体概念合并的准确率,提升融合农业领域本体的质量,对领域内大规模融合农业领域本体,实现农业领域知识的充分共享与复用,实现农业领域知识的充分共享和协同服务。
文档编号G06F17/27GK102236641SQ20111012861
公开日2011年11月9日 申请日期2011年5月18日 优先权日2011年5月18日
发明者张友华, 徐济成, 朱诚, 李绍稳, 林潇, 王凯, 辜丽川 申请人:安徽农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1