基于粗糙集的医疗辅助检查系统知识获取和推理方法_2

文档序号：9929716阅读：来源：国知局

[0053] 步骤1:数据预处理，根据数据离散化准则(见表2)量化处理数据，形成离散化决策数据表，如表3所示。
[0054] 表2离散化标准「0化51

[005引步骤2:利用基于遗传算法的粗糖集约简方法实现数据约简，删除冗余的属性。算法如下：
[0059] 1)计算核属性；
[0060] 2)用核属性初始化种群，1代表被选中属性，0则相反，核属性初始化为1，其余属性随机初始化0或1;
[0061] 3)根据适应度函数计算适应度，如果满足条件，则返回最优染色体，否则进行遗传操作
[0062] 根据上述约简算法处理决策表3,表4中13个属性被消去5个冗余属性之后的约简结果。
[0063] 表4属性约简结果 FOOMl
L0065」步骤3:根据表4的约简结果进一步处理决策表，删除表2中的冗余的5个属性，形成简化的初始规则库表5。将简化后的决策表转化为规则，并根据规则支持度，形成确定规则库表6和不确定规则库表7。
[0066]表5:初始规则库
[0067]
[C
[0069]表6确定规则库
[0070]
[
[
[0073]
[0074] 步骤4:由上面的规则库可知，系统的输入可W记为Xl (Vl)八x2 (v2)八x3 (v3) 八x4 (v4)八巧（v5)八x6 (v6)八巧（v7)Ax8 (v8)，其中Xi (Vi)分别为条件属性和相应的条件属性值，如果输入规则与规则库匹配成功，则有相应的输出，但是输入数据与知识库中规则进行匹配，有下列S种情况：
[0075] 1)只有一条规则的前件与输入数据完全匹配；
[0076] 2)多条规则的前件与输入数据完全匹配；
[0077] 3)多条规则的前件与输入数据部分匹配；
[0078] 所W，考虑规则每一个前件的重要性非常有必要，而且属性重要性完全可W作为一种启发知识应用到推理过程中。
[00巧]推理过程：
[0080] (1)当前输入与一条规则前件匹配，每个属性依次匹配，并将之求和temp_e，即 temp_e + = temp_e，则temp_e为当前规则中能够匹配上的所有前件的属性重要性之和。获得所有约简属性重要性之和，记做rule_e。
[0081 ] (2)计算匹配度 e = temp_e/；rule_￡；*0i。
[0082] (3)重复步骤1和步骤2,直到遍历了所有的规则。
[0083] (4)为获得的所有匹配度进行降序排列，取前=个匹配度较高的用作推理。进行归一化处理:求出S个匹配度之和记作sum,求出输出为0的匹配度之和记作sumo,求出输出为 1的匹配度之和记作S皿1。
[0084] (5)输出丫 =sum〇/sum*0+sumi/sum*l。
[0085] (6)分别在确定规则数据库和不确定数据库就行（1)-巧)步骤，得到输出丫 1，丫 2，引入调节参数k= 2 Su卵o;rt(R雜)/Suppo;rt(R)，则最终输出丫 =k*;ri+ 丫 2*(l-k)，0<k<l。 (丫介于0和1之间）。
[00化]综上所述：
[0087]本文提出了一种基于粗糖集的生活方式病研究新方法。该方法首先利用粗糖集描述构建医学知识库的过程，约简原有数据的冗余属性，缩减规则库的规模，采用的约简算法 W核属性初始化种群，对初始种群的对应基因位加 W限制，使其具有部分决策表约简后保留的结果属性特征，避免了种群产生的盲目性，减少了很大的捜索空间，提高了约简结果的准确性，提高了构建知识库的有效性。利用改进的基于属性重要性的推理方法进行推理，属性重要性的获得不需要任何先验经验，完全从论域的样本空间获得，避免了主观性，而且引入确定和不确定规则库，通过参数k权值的分配，考虑每条规则的重要性，调节输出，有效的推断得病几率，此方法具有很好的共用性，也可W应用到糖尿病、高血压等其他生活方式病的分析数据检测中。
【主权项】
1. 一种基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于该方法的步骤如下： (1) 利用粗糙集理论对生理信息数据进行数据挖掘，构建知识库： 1) 进行数据预处理，即对采集到的原始数据进行量化处理，根据数据离散化准则处理数据，确定条件属性和决策属性，形成决策数据表； 2) 进行属性约简，即在保持属性分类能力不变的前提下，利用基于遗传算法的粗糙集约简方法进行属性约简，删除其中不相关或不重要的属性； 3) 进行属性值约简，即去除每条规则中冗余的属性值，得到简化的决策数据表； 4) 进行规则提取，即根据约简后的属性决策数据表，合并相同或相关的规则，计算规则的支持度和准确度，提取出支持度高的规则； 5) 进行知识库的构建，根据支持度，构建确定医学知识库和非确定医学知识库； (2) 由构建的知识库根据改进的基于属性重要性的推理方法得到推理结果； 1) 分别计算当前输入与确定医学知识库和非确定医学知识库中的已有规则的匹配度； 2) 分别将确定医学知识库和非确定医学知识库匹配度进行降序排列，取前三个匹配度高的结果，引入调节参数k，得到推理结果。2. 根据权利要求1所述的基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于:步骤(1)的步骤2)中利用基于遗传算法的粗糙集约简方法进行属性约简，以及首次利用改进的基于属性重要性的推理方法并引入确定医学知识库和不确定医学知识库。3. 根据权利要求2所述的基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于:利用基于遗传算法的粗糙集约简方法进行属性约简，其过程如下： 1) 计算核属性； 2) 利用核属性进行种群的初始化； 3) 根据适应度函数计算适应度； 4) 如果达到最大迭代次数或者适应度平均值在连续若干代没有发生变化的时刻作为终止条件，返回最优染色体，否则进行遗传操作。4. 根据权利要求2所述的基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于:首次利用改进的基于属性重要性的推理方法，其过程如下： 1)分别计算当前输入与确定医学知识库和非确定医学知识库中的已有规则的匹配度；然后分别将确定医学知识库和非确定医学知识库匹配度进行降序排列，取前三个匹配度高的结果，引入调节参数k，考虑规则的重要性，得到推理结果。5. 根据权利要求1所述的基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于:该方法的实现过程分为两部分:基于粗糙集理论的生理信息知识库的构建;改进的基于属性重要性的推理方法：输入数据与知识库中规则进行匹配，有下列三种情况： 1) 只有一条规则的前件与输入数据完全匹配； 2) 多条规则的前件与输入数据完全匹配； 3) 多条规则的前件与输入数据部分匹配；所以，考虑规则每一个前件的重要性非常有必要，而且属性重要性完全可以作为一种启发知识应用到推理过程中：属性重要性的定义:SCD(C'）= γ C(D)- γ (D)其中C代表条件属性，D代表决策属性；支持度的定义WiSupportUihR为规则，α匹配相应规则的对象数目；定义匹配度f i = 1，2，3...其中β为准确度，f代表条件属性与规则属性匹配上；推理过程： (1) 当前输入与一条规则前件匹配，每个属性依次匹配，并将之求和tempj，即temp_e+ = temp」，则temp」为当前规则中能够匹配上的所有前件的属性重要性之和;获得所有约简属性重要性之和，记做rule」； (2) 计算匹配度e = temp_e/rule_e*0i; (3) 重复步骤1和步骤2,直到遍历了所有的规则； (4) 为获得的所有匹配度进行降序排列，取前三个匹配度较高的用作推理;进行归一化处理:求出三个匹配度之和记作sum，求出输出为0的匹配度之和记作sumo,求出输出为1的匹配度之和记作sumi; (5) 输出 γ =sum〇/sum*0+sumi/sum*l; (6) 分别在确定规则数据库和不确定数据库就行（1)一（5)步骤，得到输出γι，γ2，引入调节参数k= Σ Support(R縦)/Support(R)，则最终输出 γ =k*ri+ γ 2*(l_k)，0〈k〈l; ( γ 介于0和1之间）。
【专利摘要】一种基于粗糙集的医疗辅助检查系统知识获取和推理方法，其特征在于该方法的步骤如下：（1）利用粗糙集理论对生理信息数据进行数据挖掘，构建知识库:（2）由构建的知识库根据改进的基于属性重要性的推理方法得到推理结果；分别将确定医学知识库和非确定医学知识库匹配度进行降序排列，取前三个匹配度高的结果，引入调节参数k，得到推理结果。本发明方法总体上处于靠前的水平。在灵敏度，特异度，准确度三个指标上保持了很好的性能，具有很好的均衡性，对心脏病诊断具有较好的推理性能和泛化能力。
【IPC分类】G06F19/00, G06N5/04
【公开号】CN105718726
【申请号】CN201610032248
【发明人】于霞, 李铁鑫
【申请人】沈阳工业大学
【公开日】2016年6月29日
【申请日】2016年1月18日

完整全部详细技术资料下载

当前第2页1 2