基于粗糙集的医疗辅助检查系统知识获取和推理方法

文档序号:9929716阅读:456来源:国知局
基于粗糙集的医疗辅助检查系统知识获取和推理方法
【技术领域】 [0001] :本发明提供一种基于粗糖集的知识获取和推理的方法,属于数据挖掘 及不确定推理领域。本发明可W在知识获取、故障诊断、专家系统等领域得到广泛应用。
【背景技术】 [0002] :随着生活环境的改善与生活习惯的改变,癌症、屯、脏疾病、糖尿病、高血 压等疾病逐渐成为威胁人类生命的主要杀手,而人类身体健康的问题并非一朝一夕,而是 与日常生活紧密相关,不健康的生活所带来的健康问题日益严重,不良的固定模式的生活 习惯会导致各种身体问题。因此,对身体状况的的早期关注、早期改善显得尤为重要。
[0003] 常规的模糊推理系统大多由专家经验建立模糊规则,专家经验带有一定的主观 性,而且得到的信息往往不完备、不精确,症状也具有复杂性。

【发明内容】

[0004] 发明目的:本发明提供一种基于粗糖集的医疗辅助检查系统知识获取和推理方 法,其目的是解决W往的知识库的建立过程中所存在的数据不精确、不完备等问题。本发明 首次把基于遗传算法的粗糖集约简方法运用到生活方式病的属性约简中,首次提出改进的 基于属性重要性的推理方法,考虑规则和每个条件属性的重要性。
[0005] 本发明首先利用粗糖集描述构建生理信息知识库的过程,利用基于遗传算法的粗 糖集约简方法约简原有数据的冗余属性,并提取有效规则构建确定知识库和不确定知识 库。再利用粗糖集中属性重要性的概念,得到匹配度概念,引入调解参数,做出正确的推理。
[0006] 技术方案:
[0007] -种基于粗糖集的医疗辅助检查系统知识获取和推理方法,其特征在于该方法的 步骤如下:
[000引(1)利用粗糖集理论对生理信息数据进行数据挖掘,构建知识库:
[0009] 1)进行数据预处理,即对采集到的原始数据进行量化处理,根据数据离散化准则 处理数据,确定条件属性和决策属性,形成决策数据表;
[0010] 2)进行属性约简,即在保持属性分类能力不变的前提下,利用基于遗传算法的粗 糖集约简方法进行属性约简,删除其中不相关或不重要的属性;
[0011] 3)进行属性值约简,即去除每条规则中冗余的属性值,得到简化的决策数据表;
[0012] 4)进行规则提取,即根据约简后的属性决策数据表,合并相同或相关的规则,计算 规则的支持度和准确度,提取出支持度高的规则;
[0013] 5)进行知识库的构建,根据支持度,构建确定医学知识库和非确定医学知识库;
[0014] (2)由构建的知识库根据改进的基于属性重要性的推理方法得到推理结果;
[0015] 1)分别计算当前输入与确定医学知识库和非确定医学知识库中的已有规则的匹 配度;
[0016] 2)然后分别将确定医学知识库和非确定医学知识库匹配度进行降序排列,取前S 个匹配度高的结果,引入调节参数k,得到推理结果。
[0017] 步骤(1)的步骤2)中利用基于遗传算法的粗糖集约简方法进行属性约简,W及首 次利用改进的基于属性重要性的推理方法并引入确定医学知识库和不确定医学知识库。
[0018] 利用基于遗传算法的粗糖集约简方法进行属性约简,其过程如下:
[0019] 1)计算核属性;
[0020] 2)利用核属性进行种群的初始化;
[0021] 3)根据适应度函数计算适应度;
[0022] 4)如果达到最大迭代次数或者适应度平均值在连续若干代没有发生变化的时刻 作为终止条件,返回最优染色体,否则进行遗传操作。
[0023] 首次利用改进的基于属性重要性的推理方法,其过程如下:
[0024] 1)分别计算当前输入与确定医学知识库和非确定医学知识库中的已有规则的匹 配度;
[0025] 然后分别将确定医学知识库和非确定医学知识库匹配度进行降序排列,取前=个 匹配度高的结果,引入调节参数k,考虑规则的重要性,得到推理结果。
[0026] 该方法的实现过程分为两部分:基于粗糖集理论的生理信息知识库的构建;改进 的基于属性重要性的推理方法:
[0027] 输入数据与知识库中规则进行匹配,有下列S种情况:
[00%] 1)只有一条规则的前件与输入数据完全匹配;
[0029] 2)多条规则的前件与输入数据完全匹配;
[0030] 3)多条规则的前件与输入数据部分匹配;
[0031] 所W,考虑规则每一个前件的重要性非常有必要,而且属性重要性完全可W作为 一种启发知识应用到推理过程中:
[0032] 属性重要性的定义:ScD(C')= 丫 C(D)- 丫 C-C'(D)其中C代表条件属性,D代表决策属 性;
[0033] 支持度的定义:a = Support(Ri),R为规则,a匹配相应规则的对象数目;
[0034] 定义匹配度
庚中e为准确度,f代表条件属性与规 则属性匹配上;
[0035] 推理过程:
[0036] (1)当前输入与一条规则前件匹配,每个属性依次匹配,并将之求和temp_e,即 temp_e + = temp_e,则temp_e为当前规则中能够匹配上的所有前件的属性重要性之和。获得 所有约简属性重要性之和,记做rule_e。
[0037] (2)计算匹配度 e = temp_e/;rule_£;*0i。
[003引(3)重复步骤1和步骤2,直到遍历了所有的规则。
[0039] (4)为获得的所有匹配度进行降序排列,取前=个匹配度较高的用作推理。进行归 一化处理:求出S个匹配度之和记作sum,求出输出为0的匹配度之和记作sumo,求出输出为 1的匹配度之和记作S皿1。
[0040] (5)输出丫 =sum〇/sum*0+sumi/sum*l。
[0041] (6)分别在确定规则数据库和不确定数据库就行(1)-巧)步骤,得到输出丫 1,丫 2, 引入调节参数k= 2 Su卵ort(防脆)/Suppo;rt(R),则最终输出丫 =k*;ri+ 丫 2*( 1-k),0<k<l。 (丫介于0和1之间)。
[0042] 优点及效果:本发明专利提供一种基于粗糖集的医疗辅助检查系统知识获取和推 理方法,其能有效地分析和处理运些不精确、不完备的数据,并有可能直接提取出隐含的知 识,同时它仅利用数据本身所提供的信息,不需要任何附加信息或先验知识。因此将粗糖集 理论应用到生活方式病的知识获取中,构建检查有关生活方式病的规则库。然后在粗糖集 构造的规则库的基础上,依据规则,利用改进的基于属性重要性的推理方法,对生活方式病 的数据进行检查分析。并利用临床数据验证所得到规则库的真实性和准确性W及推理方法 的有效性。
[0043] 该方法首先利用粗糖集描述构建医学知识库的过程,约简原有数据的冗余属性, 缩减规则库的规模,采用的约简算法W核属性初始化种群,对初始种群的对应基因位加 W 限制,使其具有部分决策表约简后保留的结果属性特征,避免了种群产生的盲目性,减少了 很大的捜索空间,提高了约简结果的准确性,提高了构建知识库的有效性。利用改进的基于 属性重要性的推理方法进行推理,属性重要性的获得不需要任何先验经验,完全从论域的 样本空间获得,避免了主观性,而且引入确定和不确定规则库,通过参数k权值的分配,考虑 每条规则的重要性,调节输出,有效的推断得病几率.
[0044] 本发明将粗糖集理论应用到人们生理信息与健康状况相关性的获取中,探讨基于 粗糖集的生活方式病的知识发现模型,利用基于遗传算法的粗糖集约简方法进行属性约 简,根据约简后的属性建立新的决策表并产生规则,根据支持度,构建确定医学知识库和非 确定医学知识库,然后采用改进的基于属性重要性的推理方法,利用输入匹配确定医学知 识库和不确定医学知识库中已有规则,构建推理检测系统。并利用U n i V e r S i t y O f California at Irvine(UCI)machine learning repository database(UCI机器学习数据 库)中的临床数据验证所得到规则库的准确性W及改进的基于属性重要性的推理方法的有 效性,并与其它类似方法做了对比,对比结果见表1:
[0045] 表1本发明方法与其他方法的对比结果
[0046]
[0047]
[0048] 本发明方法总体上处于靠前的水平。在灵敏度,特异度,准确度=个指标上保持了 很好的性能,具有很好的均衡性,对屯、脏病诊断具有较好的推理性能和泛化能力。
【附图说明】:
[0049] 图1为本发明的设计流程图。
【具体实施方式】 [0050] :下面结合附图对本发明做进一步的说明:
[0051] 如图1所示,本发明提供一种基于粗糖集的医疗辅助检查系统知识获取和推理方 法。如图1所示,本发明的实现过程分为两部分:基于粗糖集理论的生理信息知识库的构建; 改进的基于属性重要性的推理方法。
[0052] 我们使用了 UCI机器学习数据库中的屯、脏病数据库作为例子,描述屯、脏病各生理 信息与身体健康状况之间的相关性,此数据库包含13个生理信息。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1