一种基于广义神经网络聚类的疾病病种诊疗方案预测方法

文档序号:9200574阅读:355来源:国知局
一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
【技术领域】
[0001] 本发明涉及一种基于模糊聚类分析的疾病病种诊疗方案聚类模型,并在此基础上 构建基于模糊聚类与广义神经网络相结合的广义神经网络减法聚类FCM算法模型,从而对 患者的疾病病种诊疗方案进行分类的预测方法。
【背景技术】
[0002] 随着人口老龄化以医疗信息化的不断发展,在保障医疗质量和临床医生工作效率 同时,如何有效地控制医疗成本、降低医疗开支、提高医疗资源的利用效率,已成为政府机 关、医疗机构以及保险机关的共同目标。临床路径作为一种标准化治疗模式在医疗机构中 得到了普遍的应用,但在具体实施过程中,如何得到基于医学的临床决策支持,也已经成为 亟待解决的问题。

【发明内容】

[0003] 本发明的目的是提供一种基于广义神经网络聚类的疾病病种诊疗方案的定量分 析方法,从而实现对患者的疾病病种的诊疗方案进行分类的预测方法。
[0004] 为了达到上述目的,本发明的技术方案是提供了一种基于广义神经网络聚类的疾 病病种诊疗方案预测方法,其特征在于,包括以下步骤:
[0005] 步骤1、提取一定数量患者的非结构化的患者诊断体征数据信息后,进行结构化处 理,提取患者与目标疾病相关的体征数据信息,再结合患者的人口特征信息数据及检验检 查信息,组成患者信息矩阵;
[0006] 步骤2、依据临床医生的实际诊疗经验,根据患者的体征数据信息将患者划分为c 种类型,2 < c < n,并分别进行模糊属性赋值,从而表示患者病情的严重程度;
[0007] 步骤3、构建基于减法FCM聚类的模糊聚类分析模型,以步骤1得到的患者信息矩 阵作为输入,采用聚类分析方法对数据进行分为c种群体,其中,群内部的个体具有较高的 相似性,而不同群体个体相似度较低,在聚类过程中采用模糊C-均值聚类算法FCM进行聚 类;
[0008] 步骤4、构建基于减法FCM聚类算法的广义神经网络模型,根据模糊聚类分析模型 的聚类结果,从每一类中选择最靠近类内中心的M组数据作为神经网络训练数据训练神经 网络模型,训练过的广义神经网络聚类学习了患者病症特征以及临床路径标准病症特征参 数,并将训练结果反馈到电子病历中,针对新患者在接受临床路径时疾病病种诊疗方案进 行预测,从而实现优化临床路径决策的目的。
[0009] 优选地,在所述步骤1中,对所述患者信息矩阵中的数据进行标准化处理,将数据 压缩到[0,1]范围之内。
[0010] 优选地,所述标准化处理的步骤为:
[0011] 采用最大最小值标准化进行处理,
式中,Xkmin和Xkman是数据的最 小及最大特征根,? ^和X ik分别表示标准化前后的数据的值。
[0012] 优选地,在所述步骤1之后且所述步骤2之前,还包括:
[0013] 对所述患者信息矩阵中各特征参数的相似度进行计算,同时根据医师临床经验和 临床路径实施效果以及各特征参数之间的相关系数以及各特征参数与住院天数之间的相 关系数,对不同的特征参数设置相应的权重值,标准化后的数据矩阵乘以相应权重,作为最 终的模糊划分矩阵。
[0014] 优选地,对所述患者信息矩阵中各特征参数的相似度计算或采用夹角余弦法计算 各个特征参数之间的相似度统计量,或采用最大最小法计算各个特征参数之间的相似度统 计量,或采用相关系数法计算各个特征参数之间的相似度统计量,或采用数量级法计算各 个特征参数之间的相似度统计量。
[0015] 优选地,所述采用模糊C-均值聚类算法FCM进行聚类是用隶属度确定每个元素属 于某个类别程度的一种聚类算法,它从事先给出的c个划分出发,通过反复修改样本类别、 聚类中心以及样本的隶属度,来获取样本与聚类中心的加权距离最小的最优分类,FCM算法 把η个数据向量xk分为c个模糊类,并求每类的聚类中心P= (P1,p2,…,p。},从而使模糊 目标函数最小,模糊聚类目标函数为
[0016]
[0017] 由于FCM算法在迭代过程中受空间维数的影响,往往会陷入局部最优化,因此在 利用FCM算法之前首先利用减法聚类产生初始的聚类中心,在进行FCM聚类,其步骤包括:
[0018] 步骤3. 1 :进行减法聚类,获取聚类类别数C及聚类中心ρ°,模糊聚类权值指数m, 设置迭代停止阀值ε和迭代计数器b = 0 ;
[0019] 步骤3. 2 :根据公式
计算模糊隶属度矩阵u ;
[0020] 步骤3. 3 :根据公式, -计算每类中心V ;
[0021] 步骤3. 4:根据公式
计算模糊聚类目标值,判断是否满足 |p(b+1)-Pb| I < ε,满足则算法终止,不满足则b = b+Ι,返回步骤3. 2。
[0022] 优选地,所述广义神经网络模型共4层,分别为输入层、模式层、网络求和层和输 出层,对应的输入是:X=[x1,x2,"、xn]T^aS:Y=[y 1,y2,"、yk]T;
[0023] 输入层:输入层神经元的数目等于模糊聚类之后向量的维数,各神经元是简单的 分布单元,直接将输入变量传递给网路输入层;
[0024] 模式层:模式层神经元数目等于学习样本的数目n,各神经元对应于不同的样本, 网络模式层神经元传递函数为:
[0025]
[0026] 神经元i的输出为输入变量与样本X之间距离平方D,2 =(x-岑f(x-JQ的指数形 式,式中,X为输入变量;Xi为第i个神经元对应的样本;
[0027] 求和层:通过计算公式
对模式层的神经元进行加权 求和,模式层第i个神经元与求和层中第j个神经元之间的权重为第i个输出Yi中的第j 个元素,传递函数为
[0028] 输出层:输出层中的神经元数目等于输出向量的维数k,各神经元将网络求和层的 输出相除,神经元j的输出对应估计结果fPQ的第j个元素,即:
[0029] 优选地,在所述广义神经网络模型中,广义神经网络求和层学习算法的推导公式 如下:
[0030] 设随机变量X和y的联合概率密度函数为f (X,y),已知X的观测值为X,则y相对 X的条件均值为:
[0031]
[0032] f表示在输入为X的条件下Y的预测输出;
[0033] 针对样本数据集{X,, JF1KL1应用非参数估计,其密度函数/(X,J):
[0034]
[0035] 式中,Xi, Yi为随机变量X和y的观测值;样本容量η ;x的维数为p ; σ为高斯函 数的宽度系数,用/(X,y)代替f (X,y),并改变积分的顺序:
[0036]
[0037] 由吁
对两个积分进行计算后可得网络的输出P(X)为:
[0038]
[0039] 本发明在研宄过程中针对医疗数据的复杂性和不确定性,以及能为临床医生提供 快速的辅助决策支持,基于此,本发明以医院的电子病历为基础,以《中国高血压防治指南》 为诊断依据,以实现对患者采用不同治疗方案中最优治疗方案为目的进行研宄。在Hadoop 环境中,以住院的高血压患者为背景,通过提取患者住院期间的个人信息、体征信息和检验 检
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1