一种医疗诊断模型的建立方法及装置的制造方法

文档序号:8339821阅读:156来源:国知局
一种医疗诊断模型的建立方法及装置的制造方法
【技术领域】
[0001] 本发明涉及医疗诊断技术领域,特别涉及一种医疗诊断模型的建立方法及装置。
【背景技术】
[0002] 传统的医疗诊断过程是医生根据临床经验对病人进行推理诊断的决策过程,其决 策的正确性取决于医生的个人经验,而且医疗诊断的决策也会受到外在因素的干扰,因而 传统的医疗诊断方法显然不能满足现代社会发展的要求。随着计算机技术的普及,很多传 统的任务都能够采用智能化的手段来处理,目前的很多机器学习方法都能够用到医疗诊断 中,基于计算机的医疗诊断由于不受疲劳、情绪等因素的影响,已成为重要的医疗诊断手 段,比传统的医疗诊断提供着更为客观和准确的决策。
[0003] 基于计算机技术的医疗诊断方法,通常是利用一些预测建模方法对历史病例等医 疗数据进行分析,从而建立医疗诊断模型,然后再用该医疗诊断模型来对新病例进行诊断。 因此,医疗诊断模型的建立方法是基于计算机技术的医疗诊断方法的关键,医疗诊断模型 必须保证高度的精准性。
[0004] 在现有技术中,用于建模的医疗数据的维数很高,而且不同类别的数据量并 不平衡,因此对医疗数据的特征选择处理过程非常关键。Guyon等人在文章"Gene Selection for Cancer Classification using Support Vector Machines,'中提出的 SVM-RFE (Recursive Feature Elimination)算法是基于 SVM 的 Wrapper 特征选择算法中最 具代表性的一种方法,该方法可以自动消除冗余的基因,产生比较紧致的基因子集。然而该 算法由于在迭代过程中采用后向特征消除,时间复杂度较高,数据处理的速度较慢,诊断能 力较低。

【发明内容】

[0005] 为解决上述技术问题,本申请提供一种医疗诊断模型的建立方法及装置,以实现 对医疗数据的快捷处理,提高诊断能力。
[0006] 本申请提供的技术方案如下:
[0007] -种医疗诊断模型的建立方法,包括:
[0008] 依据支持向量数据描述SVDD算法进行特征选择,对预存储的原始训练样本集中 的各个训练样本进行降维处理;
[0009] 依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训 练样本集进行训练,生成医疗诊断模型。
[0010] 优选地,所述原始训练样本集由{*,.,少,.})11表征,其中11£1? 1),5^£{+1,-1},5^表不 \的类别,N表示训练样本的总个数,D表示训练样本的维数,且预先设定降维后的维数r ; 贝1J,所述依据支持向量数据描述SVDD算法进行特征选择,对预存储的原始训练样本集中的 各个训练样本进行降维处理,包括:
[0011] 令所述训练样本的初始维数d = D,以F= {1,...,D}为特征索引集合,以所述原 始训练样本集h,.VAl1的子集
【主权项】
1. 一种医疗诊断模型的建立方法,其特征在于,包括: 依据支持向量数据描述SVDD算法进行特征选择,对预存储的原始训练样本集中的各 个训练样本进行降维处理; 依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样 本集进行训练,生成医疗诊断模型。
2. 根据权利要求1所述的方法,其特征在于,所述原始训练样本集由丨I1表征,其 中Xie RD,yie {+1,-1},y i表示X撕类别,N表示训练样本的总个数,D表示训练样本的维 数,且预先设定降维后的维数r ;则,所述依据支持向量数据描述SVDD算法进行特征选择, 对预存储的原始训练样本集中的各个训练样本进行降维处理,包括: 令所述训练样本的初始维数d = D,以F = {1,...,D}为特征索引集合,以所述原始训 练样本集的子集为特征选择训练集合,求解所述SVDD的优化问题
min Λ 得到Qi, i = 1,...,η,其中,f中的特征由所述 s.t. ^ = I, O < a. < C i=l , 特征索引集合F确定且为同一类别的训练样本,η为+1类样本的个数,api = l,...,n是 Lagrange乘子,C为预先设定的惩罚因子且C>0 ; η _ \ ' tyfj 依据所述α i,i = 1,. . .,n计算中心向量w : W = 其中w = [W1, W2,…,wd] T e Rd; 依据所述中心向量w查找被剔除的第j个特征^ = W . ? 令所述训练样本的低维维数d' = d-Ι,依据所述第j个特征更新所述特征索引集合F = F\j和所述特征选择训练集合|^~,乃=+l|(=i其中,中的特征是由索引集合F来确定 的; 判断所述d'是否等于预先设定的降维后的维数r,若不等于,则令d = d',并重复上述 步骤。
3. 根据权利要求2所述的方法,其特征在于,还包括: 若所述d'等于预先设定的降维后的维数r,则结束循环,经过降维处理后得到的低维 训练样本组成的低维训练样本集由表征,其中
4. 根据权利要求3所述的方法,其特征在于,所述依据支持向量机训练算法对经过 降维处理后得到的低维训练样本组成的低维训练样本集进行训练,生成医疗诊断模型,包 括: 依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样 本集卜,:)^Λ进行训练,生成医疗诊断模型I(xZ) = sgn(其尾xZ+的,其中,Χ? β龙b是由支持向量机训练算法训练产生的模型系数,sgn〇表示符号函数。
5. 根据权利要求1所述的方法,其特征在于,还包括: 通过所述SVDD算法进行特征选择,对接收到的测试样本集中的各个测试样本进行降 维处理,并将经过降维处理后得到的低维测试样本组成的实测样本集输入所述医疗诊断模 型中,对所述实测样本集进行预测,将预测结果作为对所述测试样本集的诊断结果。
6. -种医疗诊断模型的建立装置,其特征在于,包括: 特征选择模块,用于依据支持向量数据描述SVDD算法进行特征选择,对预存储的原始 训练样本集中的各个训练样本进行降维处理; 模型建立模块,用于依据支持向量机训练算法对经过降维处理后得到的低维训练样本 组成的低维训练样本集进行训练,生成医疗诊断模型。
7. 根据权利要求6所述的装置,其特征在于,所述原始训练样本集由表征,其 中Xie R D,yie {+1,-1},y i表示X 类别,N表示训练样本的总个数,D表示训练样本的 维数,且预先设定降维后的维数r ;则,所述特征选择模块,具体用于: 令所述训练样本的初始维数d = D,以F = {1,...,D}为特征索引集合,以所述原始训 练样本集丨XphKI1的子集=+1^为特征选择训练集合,求解所述SVDD的优化问题 min ΣΣ^? (^)-Ρ^? (<) __ η'1 ' j 得到α i,i = 1,. . .,η,其中,χ;"'"中的特征由所述 s.t. 0 < < C 7 i=l 特征索引集合F确定且为同一类别的训练样本,n为+1类样本的个数,dpi = l,...,n是 Lagrange乘子,C为预先设定的惩罚因子且C>0 ; η _ ^ twi 依据所述α i,i = 1,. . .,n计算中心向量w : w = 其中w = [W1, W2,…,wd] ?=Ι , Te Rd; 依据所述中心向量w查找被剔除的第j个特征/ = SitV1I 令所述训练样本的低维维数d' = d-Ι,依据所述第j个特征更新所述特征索引集合F = F\j和所述特征选择训练集合<[〇=+£%其中,^中的特征是由索引集合F来确定 的; 判断所述d'是否等于预先设定的降维后的维数r,若不等于,则令d = d',并重复上述 步骤。
8. 根据权利要求7所述的装置,其特征在于,所述特征选择模块,还用于: 若所述d'等于预先设定的降维后的维数r,则结束循环,经过降维处理后得到的低维 训练样本组成的低维训练样本集由乃}=表征,其中f e iT。
9. 根据权利要求8所述的装置,其特征在于,所述模型建立模块,具体用于: 依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样 本集{^ν,}Λ进行训练,生成医疗诊断模型.,(xZ) =sgn(Z (x,.) xZ+Z)),其中,万e iT, β龙b是由支持向量机训练算法训练产生的模型系数,sgnO表示符号函数。
10.根据权利要求6所述的装置,其特征在于,还包括: 医疗诊断模块,用于通过所述SVDD算法进行特征选择,对接收到的测试样本集中的各 个测试样本进行降维处理,并将经过降维处理后得到的低维测试样本组成的实测样本集输 入所述医疗诊断模型中,对所述实测样本集进行预测,将预测结果作为对所述测试样本集 的诊断结果。
【专利摘要】本申请提供一种医疗诊断模型的建立方法及装置,该方法首先依据支持向量数据描述SVDD算法进行特征选择,对预存储的原始训练样本集中的各个训练样本进行降维处理,然后依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练,生成医疗诊断模型。这种医疗模型的建立方法在迭代过程中通过SVDD算法的特征选择,根据给定的排序准则删除若干个不重要特征,可以降低建模过程的时间复杂性,实现对医疗数据的快捷处理,提高诊断能力。
【IPC分类】G06F19-00
【公开号】CN104657574
【申请号】CN201410262085
【发明人】张莉, 曹晋, 鲁亚平, 王邦军, 何书萍, 李凡长, 杨季文
【申请人】苏州大学
【公开日】2015年5月27日
【申请日】2014年6月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1