一种基于云本体的茶树虫害智能诊断原型系统的制作方法

文档序号:6375607阅读:284来源:国知局
专利名称:一种基于云本体的茶树虫害智能诊断原型系统的制作方法
技术领域
本技术方案是计算机信息技术在农业领域的应用,具体是一种基于云本体的茶树虫害智能诊断原型系统。
背景技术
茶起源于中国,中国有着源远流长的饮茶历史,也是世界上重要的茶叶产地。我国茶叶产业的飞速发展,对茶学领域知识的服务提出了更高的要求。茶学领域内容极其丰富庞大,包括茶的种类、茶的产地、茶叶的栽培、茶的生物化学、茶文化、茶食品以及茶树病虫
_坐坐舌寸寸ο
纵观整个茶学领域,茶树病虫害是我国茶叶生产的重点。由于气候温暖、空气湿润、环境多样等原因,茶树昆虫区系复杂,种类繁多,发病严重,为茶叶生产带来严重威胁。因此,能否及时诊断与防治病虫害成为大家共同关心的问题。为了减少病虫害带来的损失,除了推广和普及诊断防治知识之外,研究开发各种诊断专家系统,协助茶叶生产者及早诊断与防治茶树病虫害,便成了众多研究机构的研究方向。在实际应用中还发现茶树虫害领域中存在大量不确定性知识,无法使用本体语言进行精确表达。用自然语言描述的茶树发病症状和害虫体征,其内容有很多属于模糊概念,意思相近的词语之间的区别没有严格的定义和划分。诸如黄色、浅黄色、深黄色、黄白色、鹅黄色等,这些词语都是些模糊的相对的概念,不适宜出现在本体和系统中作为判定依据。而气候、环境、旱涝等随机性因素亦会对虫害诊断结果造成不同的影响。不确定性的概念实际是自然语言的不确定性,这种不确定性显而易见,而概念间的关系中同样存在相当的不确定性。无论是分类关系还是非分类关系,都存在许多确定的关系,例如“鞘翅目-天牛科”、“吸汁-芽叶”等等,这些关系是是既定事实,不存在不确定性。但是,概念间关系中也存在很多诸如“天阴-下雨”这样的不确定性的关系。在涉及到茶树虫害领域知识的本体构建中,这类不确定性关系的出现不可避免。对于不确定性知识的处理,现有技术红可以采用云模型概念,该云模型概念可以普遍适用于数据挖掘、决策分析、智能控制和图像处理等众多领域。云模型是用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型。设X是一个普通集合。X={x},称为论域。关于论域X中的模糊集合2,是指对于任意元素X
都存在一个有稳定倾向的随机数,叫做X对j的隶属度。如果论域中的元素是简单有
序的,则X可以看作是基础变量,隶属度在X上的分布叫做隶属云;如果论域中的元素不是简单有序的,而根据某个法则f,可将X映射到另一个有序的论域)^上,中的一个且只有一个X ^和X对应,则X丨为基础变量,隶属度在X丨上的分布叫做隶属云。云的三个数字特征分别是期望ExJg En,超熵He。期望Ex是论域的中心值,它永远都隶属于这个定性概念,且最能够代表这个定性概念。反映在云形上就是云的“最高点”,即隶属度为I的点。熵En表示一个定性概念可被度量的范围,熵越大概念越宏观,即可被度量的范围越广。熵En反映了模糊概念的亦此亦彼性的裕度,即这个定性概念的不确定性,又称模糊性,反映在云形上就表示云的“跨度”,即熵越大,云的“跨度”越大。超熵He是指熵的熵,它表示样本出现的随机性,即熵的不确定性,在云图上即云滴(请说明一下“云滴”的概念)的离散程度,超熵将模糊性和随机性相关联,它反映在云形上表示云的“厚度”,超熵越大,云越“厚”。这三个数字特征把模糊性和随机性结合在一起,非常形象的把云的形状展示出来,完成了定性和定量间的相互映射,很好地解决了不确定性知识的表达问题。定性概念和定量数据之间的转换通过云发生器来实现。云发生器(CloudGenerator,简称CG)即云生产算法,可以通过模块化的软件实现,也可以通过固化的硬件实现。按实现的功能不同,云发生器可划分为正向云发生器和逆向云发生器。正向云发生器是一个前向的、直接的过程,输入三个云的数字特征(Ex,En, He)以及需要生成的云滴数,输出每个云滴的坐标,以及每个云滴代表的确定度。正向云发生器的 生成算法如下输入各定性概念的三个数字特征(Ex,En, He),生成云滴的个数η。输出η个云滴X及其确定度μ (可用drop (Xi, μ ) , i = 1,2···,η来表示)。算法步骤以En为期望值、He2为方差,生成一个正态随机数En' ^NORKEn1He2);以Ex为期望值、丑《;2为方差,生成一个正态随机数JCi = NORMi /‘>,);计算Yi = exp [-(χ「Εχ) 2/2 (En ' )2];生成η个具有确定度μ i云滴Xi或表示为drop (Xi, μ ;逆向云发生器是正向云发生器的逆过程,它输入符合某一种分布的云滴,输出该云模型对应的的三个数字特征(Ex,En, He),逆向云发生器的生成算法如下输入样本点Xi,其中i = 1,2,…,η ;输出反映定性概念的数字特征(Ex,En, He);算法步骤
_ I η 'j η_根据Xi计算该组数据的样本均值Ζ = ,—阶样本绝对中心矩;,
n i=l n i=l
样本方差~γΣ^/ -' )
η — I ..[Ex = X .En = x—^\xf -Ex\;He = ^S2 -En1 。根据不同的给定条件,云发生器还可以分成X条件云发生器和Y条件云发生器,在论域中给定数值X的条件下的云发生器称为X条件云发生器;给定隶属度值μ的条件下的云发生器称为Y条件云发生器。另外云模型中的3个数字特征(Ex,En,He)可以是多维的,表示一个概念的多维属性。那么对一维的正向云发生器进行改造,输入两组或多组数字特征,就可构成二维或多维的正向云发生器,逆向二维及多维云发生器可对照一维逆向云发生器同理可得。

发明内容
针对茶学领域虫害诊断过程中存在的问题,本发明研究构建了茶树虫害领域本体,并研制开发了基于本体的茶树虫害智能诊断原型系统。该系统对于茶树虫害领域知识的有效表达、组织管理以及复用共享,提高茶树虫害诊断防治的准确率和诊断防治速度,具有很强的理论研究价值和实际意义。一种基于云本体的茶树虫害智能诊断原型系统,该系统包括概念提取模块、茶树虫害领域本体概念的云化模块、概念间分类关系的云化模块、概念间非分类关系的云化模块、智能查询模块和诊断模块、结果输出模块;本方法的步骤包括I)用户将已经过处理的茶树虫害领域本体知识导入本诊断原型系统;2)导入的茶树虫害领域本体知识进入概念提取模块,由概念提取模块提取茶树虫害领域本体概念; 3)再由茶树虫害领域本体概念的云化模块针对不同的茶树虫害领域本体概念,选择划分方法,对每个概念进行划分,确定其概念语言值,并将划分后的概念输入相应云发生器进行云化;4)已云化的茶树虫害领域本体概念,分别进入概念间分类关系云化模块和概念间非分类关系云化模块中;5)由概念间分类关系云化模块和概念间非分类关系云化模块对已云化的茶树虫害领域本体概念进行分类关系提取;再分别对提取的每对分类关系处理得到概念间云化的分类关系,对提取到的非分类关系处理得到概念间云化的非分类关系;6)概念间云化的分类关系和概念间云化的非分类关系通过一致性检测后生成茶树虫害领域云本体;7)智能查询模块和诊断模块在接收用户的查询提问后,对用户提交的关键词进行语义分析,然后通过在线交互界面反馈关键词语义信息给用户,由用户进一步选择判断并输入本诊断原型系统;8)重复步骤7),直至返回用户满意的关键词语义信息;再构造相应的检索式,将查询语句交给云本体,得出云本体中所有具有语义关联的类以及实例;由智能查询模块和诊断模块诊断出结果,再通过结果输出模块返回诊断结果给用户;9)由用户点击诊断查询结果,显示出虫害的特征、发病症状和防治方法信息。所述茶树虫害领域本体概念的云化模块中的茶树虫害领域本体概念云化方法是,首先从茶树虫害领域知识中提取概念,再对概念中的不同语言值进行划分,最后用云模型表示,使概念不用通过语言的二次表达,就能够直观的表达不确定性的概念;a)从茶树虫害领域知识中提取概念的方法首先通过中文分词的方法,先对茶树虫害领域语料进行切分;中文分词后的语料被划分成一个个单个词语,利用互信息技术,从切分后的语料中得到候选概念集合;最后通过领域相关性判断剔除非合成词,最终提取出茶树虫害领域本体的概念;b)对概念中的不同语言值进行划分的方法在茶树虫害领域有各种类型的不确定性概念中对于直接能用数值表达的概念的划分中,先确定长度和宽度的范围;第二步再在这个范围内等量化分间距,即可得到划分好的不确定性概念;对于不能直接用数值表达的概念的划分中,据不同的概念采取相应的转化方法划分概念;c)用云模型表示使概念不用通过语言的二次表达,即概念云化方法概念云化的过程可以细化成三个步骤步骤一遍历每个概念的属性;如果实单属性,则直接进入步骤三,如果是多属性,则进入步骤二 ;步骤二 采用云维度优选方法选取多属性概念其中一个,进入步骤三;
步骤三将划分后的概念输入相应云发生器进行云化。所述概念间分类关系的云化模块中的茶树虫害领域本体概念间分类关系云化方法包括第一步,对分类关系进行提取;第二步,对每个分类关系进行云化;第一步中,茶树虫害领域本体概念间分类关系的提取方法是,采用层次聚类方法对茶树虫害领域本体概念间分类关系进行提取,首先对已提取的茶树虫害领域概念进行聚类,再计算概念集合中的每两个概念之间的相似度;如果该相似度大于预设阈值,那么这两个概念就归并为一簇;当概念集合中的所有概念通过两两计算归并为数个簇之后,再开始进行层次聚类,获取概念层次关系;层次聚类采用平均链接方法来计算簇间的相似度,如果簇间相似度大于预定阈值,则进行簇的归并,直到所有的簇都归并为同一簇;第二步中,在分类关系提取完成后,按照概念的划分方法即直接或间接数据化方法对分类关系的每个关系对进行划分,采用主观统计的方法得到每组分类关系的数据后,选择不同的云发生器对分类关系进行云化,步骤如下步骤一对每对分类关系按照父类在左,子类在右的顺序结成分类关系对;步骤二 根据划分方法,确定划分类型,依次对每对概念进行划分;步骤三采用主观统计法,采集每个概念对的不确定性统计数据;步骤四分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望;步骤五计算熵和超熵,得到每对分类关系的云模型中的三个数字特征(期望Ex,熵En,超熵He);步骤六根据数字特征确定每对关系所用的云模型的类型,将每组数字特征输入相应的云发生器,得到每对分类关系的云图。概念间非分类关系的云化模块中的茶树虫害领域本体概念间非分类关系云化方法包括第一步,对分类关系进行提取;第二步,对每个分类关系进行云化;第一步中,采用基于关联规则的挖掘方法来提取非分类关系,算法如下第一步设置支持度阈值Sup和置信度阈值Conf ;第二步计算概念集中任意两个概念Cp Ck的支持度X和置信度y ;第三步比较支持度X与Sup的大小,置信度y与Conf的大小;第四步若x>Sup和y>Conf同时成立,则概念Cj和Ck存在关系,若不成立,跳到第
丄止
/、少;第五步提取关系对Cj和Ck ;第六步选择两个概念cj+1、ck+1,重复第二步,循环至遍历所有概念;这里j和k表不任意两个概念的编号;第二步中,先对得到的非分类关系进行分组,然后再对每组关系进行划分,最后对每个关系进行主观统计,得到的统计数据输入云发生器,得到云化的非分类关系,具体步骤如下步骤一对得到的关系对进行甄别,并按照关系种类进行分组;步骤二 分别确定每组关系对的组成结构,例如,因果关系规定因在左果在右;步骤三根据划分方法,确定划分类型,依次对每对关系进行划分;步骤四采用主观统计法,采集每个关系对的不确定性统计数据;
步骤五分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望;步骤六计算熵和超熵,得到每对分类关系的云模型中的三个数字特征(期望Ex,熵En,超熵He);步骤七根据数字特征确定每对关系所用的云模型的类型,将每组数字特征输入相应的云发生器,得到每对非分类关系的云图。所述智能查询模块和诊断模块中,查询茶树虫害知识是通过关键词查询从而检索到该关键词在云本体中的等级关系以及具体的茶树虫害相关信息;在对虫害进行诊断的过程中,是通过建立语义推理引擎,来判断用户输入的检索词之间的语义关系,实现基于知识/概念层面的查询诊断;具体是首先根据茶树虫害领域云本体关系模型,对用户提交的搜索词汇的语义进行分析,然后借助于推理规则进行语义扩展,得出云本体中所有具有隐含语义关联的类以及实例间的语义关系,最后据此扩展检索相应的数据返回给用户界面。本发明针对茶树虫害领域本体不确定性知识的表达问题,考虑将云模型概念与本体结合构建云本体,研究茶树虫害领域概念及概念间关系的云化方法,尝试将领域内不确定性知识确定化,并应用于智能诊断专家系统中,为农村信息化提供更好的科学决策服务。


图I基于云本体的茶树虫害智能诊断原型系统示意图。
具体实施例方式下面结合附图与具体实施方式
对本技术方案进一步说明如下I、茶树虫害领域本体概念云化方法研究概念是构造本体的基本元素,由于茶树虫害领域中存在大量不确定性概念,所以在构建茶树虫害领域本体时必须考虑概念的不确定性处理。首先从茶树虫害领域知识中提取概念,再对概念中的不同语言值进行划分,最后用云模型表示,使概念不用通过语言的二次表达,就能够直观的表达不确定性的概念。a)概念提取方法为了提高概念提取的效率,首先通过中文分词的方法,先对茶树虫害领域语料进行切分,中文分词后的语料被划分成一个个单个词语,但是茶树虫害领域知识中存在很多合成词语,它们虽由单个词语组成,但表达特定的意思,因此需要互信息技术,从切分后的语料中得到候选概念集合,最后通过领域相关性判断剔除非合成词,最终提取出茶树虫害领域本体的概念。在概念提取方法中,大致可分为基于词典的方法、基于统计的方法和基于规则的方法。基于统计的方法运用上下文依赖分析,领域相关性判断和互信息等技术。其中上下文依赖分析通过先分别计算左右上下文依赖参数,然后与设置的阈值相比较,判断出概念是否为一个完整的词。领域相关性判断是通过一定的公式来判断一个概念是否属于某领域,这种判断方法的主要思想是通过建立词语频度以计算出领域度值,然后与阈值比较得出相关性判断。互信息技术是通过计算两个字串之间的关联程度,来判断这些字串之间是否存在关系,该技术主要针对经过分词后的被分成单个词语的合成词语的提取。互信息技术同样需要设定阈值,只有当计算出互信息度大于该阈值,才能将几个字串作为合成词语提取。b)概念划分方法在茶树虫害领域有各种类型的不确定性概念,有的直接能用数值表示,有的概念 却要通过转化才能表达。对于直接能用数值表达的概念,例如某害虫“体型中等”,体型可用长度和宽度来衡量,在这个概念的划分中,第一步先确定长度和宽度的范围;第二步再在这个范围内等量化分间距,即可得到划分好的不确定性概念。对于能直接用数值表达的模糊概念,可用以上步骤进行划分。对于不能直接用数值表达的概念,例如某害虫体色“棕色”,与之相近的有黑色,褐色等颜色,即“棕色”与一定范围内的颜色相近。为了解决颜色不确定性表达的问题,可借助颜色代码表进行自然语言到数值的转换第一步,对照颜色代码表,确定“棕色”的代码范围;第二步将每个代码作为一个数值,组成不确定性概念“棕色”的数值范围。对于不能直接用数值表达的概念,需要根据不同的概念采取不同的转化方法划分概念。c )概念云化方法概念的云化是将不确定性概念用云图表达,在对概念进行划分后,我们需根据不同的概念划分结果,对多属性的概念进行云维度优选,最后输入云发生器得到云化的概念。根据我们对概念属性的理解,属性分为数值属性和分类属性,如害虫的体型属于数值属性,属性值为离散的数值,而害虫的危害范围就是分类属性,它可以分为无序的一些名词的集合,如叶,叶梢,树皮,茶籽等。针对数值属性,需要对其进行量化,转化为布尔类型,即可挖掘出各个属性之间的关系及属性与概念之间的关系。针对分类属性,运用布尔类型的关联规则挖掘,可以处理出各个属性之间的关系及属性与概念之间的关系。采用apriori算法将各个属性统一起来共同研究,研究它们之间的关系及它们同这个概念之间的关系,在预定义的最小支持度和最小置信度下,挖掘出频繁项集,即是频繁属性集,研究由它产生的强关联规则,说明各个属性和概念的关系,从而筛选出云维度信息。概念云化的过程可以细化成三个步骤步骤一遍历每个概念的属性,如单属性,直接进入步骤三,如多属性,进入步骤-* ;步骤二 采用云维度优选方法选取多属性概念其中一个,进入下一步;步骤三将划分后的概念输入相应云发生器进行云化。构建云本体时,我们使用云图代替具体确定数值来表达不确定性概念,这与本体的定义中“明确的”要求更加契合,更有助于体现客观性。这些云化的概念将为构建云化的分类体系和云化的非分类体系打下基础,并与它们一起构成了云化的茶树虫害领域本体知识体系,为构建能表达不确定性知识的茶树虫害领域本体服务提供支撑。2、茶树虫害领域本体概念间分类关系云化方法在分类关系中,父类与子类之间只是单纯的分类关系,如某地“旱涝-中雨”与降雨程度的分类关系,虽然10mm-25mm都有可能是预报中雨出现的最低降水量,但是不同降雨量隶属于中雨的程度是不同的,对气候、茶树、虫害的影响也不尽相同,那么如何表述这种可能性?怎么将每个子类隶属父类的程度表达出来?表述出这种不确定性就是分类关系云化中要解决的关键问题。茶树虫害领域本体概念间分类关系的云化方法由两大步组成,第一步是对分类关系进行提取,第二步再对每个分类关系进行云化。概念间分类关系的提取方法有多种,针对概念集合中包含许多没有固定的语法模式规则可以遵循的非合成词概念,我们采用层次聚类方法对概念间的分类关系进行提取。 利用层次聚类的方法进行茶树虫害领域概念间分类关系提取,首先要对已提取的茶树虫害领域概念进行聚类,计算概念集合中的每两个概念之间的相似度,如果该相似度大于预设阈值,那么这两个概念就归并为一簇。当概念集合中的所有概念通过两两计算归并为数个簇之后,开始进行层次聚类,获取概念层次关系。层次聚类采用平均链接方法来计算簇间的相似度,如果簇间相似度大于预定阈值,则进行簇的归并,直到所有的簇都归并为同一簇。在分类关系提取完成后,本发明按照概念的划分方法,即直接或间接数据化方法对分类关系的每个关系对进行划分,同样采用主观统计的方法得到每组分类关系的数据后,选择不同的云发生器对分类关系进行云化,分类关系云化具体步骤如下步骤一对每对分类关系按照父类在左,子类在右的顺序结成分类关系对;步骤二 根据划分方法,确定划分类型,依次对每对概念进行划分;步骤三采用主观统计法,采集每个概念对的不确定性统计数据;步骤四分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望;步骤五计算熵和超熵,得到每对分类关系的三个数字特征;步骤六根据数字特征确定每对关系所用的云模型的类型;步骤七将每组数字特征输入相应的云发生器,得到每对分类关系的云图。3、茶树虫害领域本体概念间非分类关系云化方法在非分类关系中,概念间的关系更加复杂,例如某因果关系“潮湿一一长势快”,环境潮湿作物长势就快,这个关系中潮湿要达到什么样的程度才会导致作物长势快?是不是潮湿都会导致长势快,会不会造成长势减缓和停止生长等情况发生?这种不确定性同样存在于其他的非分类关系中。每种类型的非分类关系区别对待、进行云化,则是非分类关系云化中所要解决的问题。茶树虫害领域本体概念间非分类关系的云化方法同样由提取和云化两大步组成,但由于非分类关系的多样化,提取和云化的具体方法有所不同。在本体概念的关系中,除了子类父类的分类关系,还存在大量的非分类关系,如因果关系,part-of关系,相关关系等。非分类的关系不仅种类繁多,而且形式多样。这给我们提取非分类关系带来了一定的难度。本发明主要基于关联规则的挖掘方法来提取非分类关系。在关联规则中,有两个衡量关联规则强度的指标支持度和置信度。规则X — Y的支持度是指T中包含XUY的事务的百分比;规则X — Y的置信度是指既包含了 X又包含了 Y的事务的数量占所有包含了X的事务的百分比。支持度是很重要的评价指标,如果它的值太小,那么说明该规则很可能是偶然发生的。而置信度决定了规则的可预测度。如果一条规则的置信度太低,那么从X就很难可靠地推断出Y。所以置信度太低的规则在实际应用中也不会有多大用处。利用关联规则来提取概念间非分类关系的算法如下第一步设置支持度阈值Sup和置信度阈值Conf ;第二步计算概念集中任意两个概念Cp Ck的支持度X和置信度y ;第三步比较支持度X与Sup的大小,置信度y与Conf的大小;第四步若x>Sup和y>Conf同时成立,则概念Cj和Ck存在关系,若不成立,跳到第
丄止 /、少;第五步提取关系对C」和Ck ;第六步j++,k++,重复第二步,循环至遍历所有概念。非分类关系与分类关系不同,因其复杂的种类,需要在云化前加一个甄别的步骤,即对得到的非分类关系进行分组,然后再对每组关系进行划分,划分方法与分类关系划分方法一致,最后对每个关系进行主观统计,得到的统计数据输入云发生器,得到云化的非分类关系,具体步骤如下步骤一对得到的关系对进行甄别,并按照关系种类进行分组;步骤二 分别确定每组关系对的组成结构,例如,因果关系规定因在左果在右;步骤三根据划分方法,确定划分类型,依次对每对关系进行划分;步骤四采用主观统计法,采集每个关系对的不确定性统计数据;步骤五分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望;步骤六计算熵和超熵,得到每对分类关系的三个数字特征;步骤七根据数字特征确定每对关系所用的云模型的类型;步骤八将每组数字特征输入相应的云发生器,得到每对非分类关系的云图。针对茶树虫害领域本体不确定性知识的表达问题,我们研究了茶树虫害领域概念及概念间关系的云化方法,构建出云本体并应用于智能诊断专家系统中,结合知识库的推理机制,对茶树虫害知识进行查询、诊断和防治服务。根据茶树虫害诊断领域知识的特点,本发明采用描述逻辑推理和语义推理相结合的方法对茶树虫害进行智能诊断推理。Prot6g6本身不具有推理的功能,但它能构造描述逻辑约束条件,并提供第三方推理软件接口,将使用OWL语言描述的云本体直接转化为描述逻辑的形式,然后进行推理服务。在虫害的诊断过程中,运用语义推理方法,首先根据用户选择的提问词进行语义关系判断,推理出各个提问词之间隐含的语义关系,然后构造相应的检索式,实现诊断推理过程。(I)描述逻辑描述逻辑是一种知识表示的形式化语言,是一阶谓词逻辑的可判定子集,具有很强的表达能力和可判定性,能够保证推理算法都能停止,并返回正确的结果。描述逻辑建立在概念和角色之上,使用构造算子从简单概念和角色中构造出复杂概念和角色。描述逻辑具有形式化的、基于逻辑的语义规范,并且概念语言推理可以从明显地表达推出隐含的内容。
云本体的推理机制是基于描述逻辑的推理,通过对约束公理及类层次结构的应用,实现类、属性、实例及其之间关系等推理,目的是保持类的一致性,检验类的构成和隐含关系,确认实例是否包含于云本体中,以及云本体的完整性维护等等。查询茶树虫害知识可以通过关键词查询从而检索到该关键词在云本体中的等级关系以及具体的虫害相关信息。Prot6g6中以树形结构表示云本体的等级体系,将云本体中的类表示为根节点,实例表示为叶子节点,点击树的节点,即可显示该节点相关的各种信息。具体步骤如下步骤一通过has Synonym属性,为概念提供不同的表达形式,使用推理引擎,实现对同义词的智能查询。步骤二 利用list Hierarchy Root Classes O方法得到云本体的根节点,然后利用list Sub ClassesO方法对根结点判断是否有子类,通过递归的方法得到所有子 类。步骤三对每个类通过list Sub Classes O方法判断并获取类的实例,利用getLocal NameO方法得到实例的名称。步骤四根据Data Properties的描述,可以得到诊断系统中具体害虫的详细信
肩、O(2)语义推理在对虫害进行诊断的过程中,传统的信息检索模型是将各个检索词看作孤立的,忽略检索词之间的语义关系,可能造成基于关键词的检索模型在一定程度上查询不到结果,或者返回大量无关的检索结果。我们通过建立语义推理引擎,来判断用户输入的检索词之间的语义关系,实现基于知识/概念层面的查询诊断,提高茶树虫害查询诊断的查全率及查准率。云本体具有良好的概念层次结构和对逻辑推理的支持,能够通过概念之间的关系来表达概念语义的能力,实现语义上的信息表示。在茶树虫害智能诊断过程中,本发明首先根据茶树虫害领域云本体关系模型,对用户提交的搜索词汇的语义进行分析,然后借助于某种推理规则进行语义扩展,比如近似/同义词的推理分析,以及词汇语义在分类结构上的扩展,得出云本体中所有具有隐含语义关联的类以及实例间的语义关系,最后据此扩展检索相应的数据返回给用户界面。具体步骤如下步骤一根据用户输入的关键词进行语义分析,并借助于推理规则进行语义扩展。比如输入茶区“皖南”,则扩展为安徽南部;输入虫害体色“黄色”,则扩展为浅黄、深黄、棕黄
坐坐寸寸ο步骤二 将上述全部扩展结果通过在线交互界面返回给用户,由用户进一步选择判断并输入系统。步骤三重复步骤一、二,通过语义关系、概念匹配、推理机制以及在线交互界面来引导用户的查询直至返回用户满意的关键词语义信息。步骤四由步骤三的结果,构造相应的检索式。将查询语句交给云本体模型,如果云本体中存在该语义关系组合,则返回诊断结果;若不存在,则返回NULL。为验证不确定性本体知识确定化的可行性和有效性,本发明采用Matlab7. O平台及Jsp/Servlet技术,开发了基于云本体的茶树虫害智能诊断原型系统,所使用的开发环境为Windows XP。该系统既可以对用户选择的条件进行虫害诊断,也可以在导航中进行害虫查询。基于云本体的茶树虫害智能诊断系统主要由茶树虫害领域本体概念的云化模块、概念间分类关系的云化模块、概念间非分类关系的云化模块、智能查询模块及诊断模块等组成,其基本框架结构如图I所示,该系统步骤流程如下步骤一用户将已经过处理的茶树虫害领域本体知识导入模型系统;步骤二 导入的茶树虫害领域本体知识进入概念提取模块,通过上下文依赖、互信息技术、领域相关性判断来提取茶树虫害领域本体概念;步骤三针对不同概念,选择划分方法,对每个概念进行划分,确定其概念语言值,并将划分后的概念输入相应云发生器进行云化。步骤四已云化的茶树虫害领域概念,分别进入分类关系云化模块和非分类关系 云化模块中。步骤五对输入分类关系云化模块的概念,采用层次聚类的的方法对其进行提取;步骤六对提取的每对分类关系按照父类在左、子类在右的顺序结成分类关系对;根据划分方法,确定划分类型,依次对每对概念进行划分;采用主观统计法,采集每个概念对的不确定性统计数据分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望,计算熵和超熵,得到每对分类关系的三个数字特征;根据数字特征确定每对关系所用的云模型的类型,将每组数字特征输入相应的云发生器,得到云化分类关系。步骤七对输入非分类关系云化模块的概念,采用关联规则挖掘的方法对其进行提取;步骤八对提取到的非分类关系对进行甄别,并按照关系种类进行分组,分别确定每组关系对的组成结构;根据划分方法,确定划分类型,依次对每对关系进行划分;采用主观统计法,采集每个关系对的不确定性统计数据,分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望,计算熵和超熵,得到每对分类关系的三个数字特征;根据数字特征确定每对关系所用的云模型的类型将每组数字特征输入相应的云发生器,得到云化的非分类关系。步骤九生成茶树虫害领域云本体并通过一致性检测。步骤十系统接收用户的查询提问后,对用户提交的关键词进行语义分析,并借助于推理规则进行语义扩展,通过在线交互界面反馈给用户,由用户进一步选择判断并输入系统。步骤十一重复步骤十,直至返回用户满意的关键词语义信息。构造相应的检索式,将查询语句交给云本体模型,得出云本体中所有具有语义关联的类以及实例。获得诊断结果后,通过结果输出模块返回给用户。步骤十二 点击诊断查询结果,可以显示出虫害的特征、发病症状和防治方法等信
肩、O通过对本系统的测试分析,取得了良好的效果,验证了该方法的可行性和有效性。基于云本体的茶树虫害智能诊断系统利用云化的概念及概念间分类关系、非分类关系可以有效解决本体中的不确定性知识表达问题,并对茶树虫害防治进行更加精确、更加客观的诊断推理,提高了茶树虫害诊断防治的准确率和诊断防治速度,以满足茶农实际需求。
基于云本体的茶树虫害智能诊断系统对于茶树虫害领域知识的有效表达、组织管理以及复用共享,提升茶树虫害智能诊断系统的问题求解和协同能力,提高茶树虫害诊断防治的智能化水平,提高农村信息化服务效率,进一步开展农业知识工程的基础理论与关键技术研究,具有一定的现实意义和实际研究价值。在此基础上,下一步将继续完善、更新 与茶树病虫害有关的实用技术信息系统,使之真正有效地成为科学种茶的有力助手,让科学种茶技术在我国广大地区迅速推广,进一步提高我国的茶叶产量和茶饮质量。
权利要求
1.一种基于云本体的茶树虫害智能诊断原型系统,其特征是该系统包括概念提取模块、茶树虫害领域本体概念的云化模块、概念间分类关系的云化模块、概念间非分类关系的云化模块、智能查询模块和诊断模块、结果输出模块;本方法的步骤包括 1)用户将已经过处理的茶树虫害领域本体知识导入本诊断原型系统; 2)导入的茶树虫害领域本体知识进入概念提取模块,由概念提取模块提取茶树虫害领域本体概念; 3)再由茶树虫害领域本体概念的云化模块针对不同的茶树虫害领域本体概念,选择划分方法,对每个概念进行划分,确定其概念语言值,并将划分后的概念输入相应云发生器进行云化; 4)已云化的茶树虫害领域本体概念,分别进入概念间分类关系云化模块和概念间非分类关系云化模块中; 5)由概念间分类关系云化模块和概念间非分类关系云化模块对已云化的茶树虫害领域本体概念进行分类关系提取;再分别对提取的每对分类关系处理得到概念间云化的分类关系,对提取到的非分类关系处理得到概念间云化的非分类关系; 6)概念间云化的分类关系和概念间云化的非分类关系通过一致性检测后生成茶树虫害领域云本体; 7)智能查询模块和诊断模块在接收用户的查询提问后,对用户提交的关键词进行语义分析,然后通过在线交互界面反馈关键词语义信息给用户,由用户进一步选择判断并输入本诊断原型系统; 8)重复步骤7),直至返回用户满意的关键词语义信息;再构造相应的检索式,将查询语句交给云本体,得出云本体中所有具有语义关联的类以及实例;由智能查询模块和诊断模块诊断出结果,再通过结果输出模块返回诊断结果给用户; 9)由用户点击诊断查询结果,显示出虫害的特征、发病症状和防治方法信息。
2.根据权利要求I所述的基于云本体的茶树虫害智能诊断原型系统,其特征是所述茶树虫害领域本体概念的云化模块中的茶树虫害领域本体概念云化方法是,首先从茶树虫害领域知识中提取概念,再对概念中的不同语言值进行划分,最后用云模型表示,使概念不用通过语言的二次表达,就能够直观的表达不确定性的概念; a)从茶树虫害领域知识中提取概念的方法 首先通过中文分词的方法,先对茶树虫害领域语料进行切分;中文分词后的语料被划分成一个个单个词语,利用互信息技术,从切分后的语料中得到候选概念集合;最后通过领域相关性判断剔除非合成词,最终提取出茶树虫害领域本体的概念; b)对概念中的不同语言值进行划分的方法 在茶树虫害领域有各种类型的不确定性概念中 对于直接能用数值表达的概念的划分中,先确定长度和宽度的范围;第二步再在这个范围内等量化分间距,即可得到划分好的不确定性概念; 对于不能直接用数值表达的概念的划分中,据不同的概念采取相应的转化方法划分概念; c)用云模型表示使概念不用通过语言的二次表达,即概念云化方法 概念云化的过程可以细化成三个步骤步骤一遍历每个概念的属性;如果实单属性,则直接进入步骤三,如果是多属性,则进入步骤二; 步骤二 采用云维度优选方法选取多属性概念其中一个,进入步骤三; 步骤三将划分后的概念输入相应云发生器进行云化。
3.根据权利要求I所述的基于云本体的茶树虫害智能诊断原型系统,其特征是所述概念间分类关系的云化模块中的茶树虫害领域本体概念间分类关系云化方法包括第一步,对分类关系进行提取;第二步,对每个分类关系进行云化; 第一步中,茶树虫害领域本体概念间分类关系的提取方法是, 采用层次聚类方法对茶树虫害领域本体概念间分类关系进行提取,首先对已提取的茶树虫害领域概念进行聚类,再计算概念集合中的每两个概念之间的相似度;如果该相似度大于预设阈值,那么这两个概念就归并为一簇; 当概念集合中的所有概念通过两两计算归并为数个簇之后,再开始进行层次聚类,获取概念层次关系;层次聚类采用平均链接方法来计算簇间的相似度,如果簇间相似度大于预定阈值,则进行簇的归并,直到所有的簇都归并为同一簇; 第二步中,在分类关系提取完成后,按照概念的划分方法即直接或间接数据化方法对分类关系的每个关系对进行划分,采用主观统计的方法得到每组分类关系的数据后,选择不同的云发生器对分类关系进行云化,步骤如下 步骤一对每对分类关系按照父类在左,子类在右的顺序结成分类关系对; 步骤二 根据划分方法,确定划分类型,依次对每对概念进行划分; 步骤三采用主观统计法,采集每个概念对的不确定性统计数据; 步骤四分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望; 步骤五计算熵和超熵,得到每对分类关系的云模型中的三个数字特征(期望Ex,熵En,超熵 He); 步骤六根据数字特征确定每对关系所用的云模型的类型,将每组数字特征输入相应的云发生器,得到每对分类关系的云图。
4.根据权利要求I所述的基于云本体的茶树虫害智能诊断原型系统,其特征是概念间非分类关系的云化模块中的茶树虫害领域本体概念间非分类关系云化方法包括第一步,对分类关系进行提取;第二步,对每个分类关系进行云化; 第一步中,采用基于关联规则的挖掘方法来提取非分类关系,算法如下 第一步设置支持度阈值Sup和置信度阈值Conf ; 第二步计算概念集中任意两个概念A、Ck的支持度X和置信度y ; 第三步比较支持度X与Sup的大小,置信度y与Conf的大小; 第四步若x>Sup和y>Conf同时成立,则概念Cj和Ck存在关系,若不成立,跳到第六I K少; 第五步提取关系对Cj和Ck ; 第六步选择两个概念(V1Aw,重复第二步,循环至遍历所有概念;这里j和k表示任意两个概念的编号; 第二步中,先对得到的非分类关系进行分组,然后再对每组关系进行划分,最后对每个关系进行主观统计,得到的统计数据输入云发生器,得到云化的非分类关系,具体步骤如下 步骤一对得到的关系对进行甄别,并按照关系种类进行分组; 步骤二 分别确定每组关系对的组成结构,例如,因果关系规定因在左果在右; 步骤三根据划分方法,确定划分类型,依次对每对关系进行划分; 步骤四采用主观统计法,采集每个关系对的不确定性统计数据; 步骤五分析每组数据,并采用正态分布曲线拟合,得到每组数据的期望; 步骤六计算熵和超熵,得到每对分类关系的云模型中的三个数字特征(期望Ex,熵En,超熵 He); 步骤七根据数字特征确定每对关系所用的云模型的类型,将每组数字特征输入相应的云发生器,得到每对非分类关系的云图。
5.根据权利要求I所述的基于云本体的茶树虫害智能诊断原型系统,其特征是所述智能查询模块和诊断模块中, 查询茶树虫害知识是通过关键词查询从而检索到该关键词在云本体中的等级关系以及具体的茶树虫害相关信息; 在对虫害进行诊断的过程中,是通过建立语义推理引擎,来判断用户输入的检索词之间的语义关系,实现基于知识/概念层面的查询诊断;具体是首先根据茶树虫害领域云本体关系模型,对用户提交的搜索词汇的语义进行分析,然后借助于推理规则进行语义扩展,得出云本体中所有具有隐含语义关联的类以及实例间的语义关系,最后据此扩展检索相应的数据返回给用户界面。
全文摘要
一种基于云本体的茶树虫害智能诊断原型系统,该系统包括概念提取模块、茶树虫害领域本体概念的云化模块、概念间分类关系的云化模块、概念间非分类关系的云化模块、智能查询模块和诊断模块、结果输出模块;本方法针对茶树虫害领域本体不确定性知识的表达问题,考虑将云模型概念与本体结合构建云本体,研究茶树虫害领域概念及概念间关系的云化方法,将领域内不确定性知识确定化,并应用于智能诊断专家系统中。
文档编号G06F19/00GK102831316SQ201210304048
公开日2012年12月19日 申请日期2012年8月24日 优先权日2012年8月24日
发明者李绍稳, 叶琼, 刘超, 吉喆, 孙靓, 张友华, 刘恺, 许高建, 张筱丹 申请人:安徽农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1