一种医疗诊断模型的建立方法及装置的制造方法

文档序号：8339821阅读：156来源：国知局

一种医疗诊断模型的建立方法及装置的制造方法
【技术领域】
[0001] 本发明涉及医疗诊断技术领域，特别涉及一种医疗诊断模型的建立方法及装置。
【背景技术】
[0002] 传统的医疗诊断过程是医生根据临床经验对病人进行推理诊断的决策过程，其决策的正确性取决于医生的个人经验，而且医疗诊断的决策也会受到外在因素的干扰，因而传统的医疗诊断方法显然不能满足现代社会发展的要求。随着计算机技术的普及，很多传统的任务都能够采用智能化的手段来处理，目前的很多机器学习方法都能够用到医疗诊断中，基于计算机的医疗诊断由于不受疲劳、情绪等因素的影响，已成为重要的医疗诊断手段，比传统的医疗诊断提供着更为客观和准确的决策。
[0003] 基于计算机技术的医疗诊断方法，通常是利用一些预测建模方法对历史病例等医疗数据进行分析，从而建立医疗诊断模型，然后再用该医疗诊断模型来对新病例进行诊断。因此，医疗诊断模型的建立方法是基于计算机技术的医疗诊断方法的关键，医疗诊断模型必须保证高度的精准性。
[0004] 在现有技术中，用于建模的医疗数据的维数很高，而且不同类别的数据量并不平衡，因此对医疗数据的特征选择处理过程非常关键。Guyon等人在文章"Gene Selection for Cancer Classification using Support Vector Machines，'中提出的 SVM-RFE (Recursive Feature Elimination)算法是基于 SVM 的 Wrapper 特征选择算法中最具代表性的一种方法，该方法可以自动消除冗余的基因，产生比较紧致的基因子集。然而该算法由于在迭代过程中采用后向特征消除，时间复杂度较高，数据处理的速度较慢，诊断能力较低。

【发明内容】

[0005] 为解决上述技术问题，本申请提供一种医疗诊断模型的建立方法及装置，以实现对医疗数据的快捷处理，提高诊断能力。
[0006] 本申请提供的技术方案如下：
[0007] -种医疗诊断模型的建立方法，包括：
[0008] 依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理；
[0009] 依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练，生成医疗诊断模型。
[0010] 优选地，所述原始训练样本集由{*,.，少,.})11表征，其中11￡1? 1)，5^￡{+1，-1}，5^表不 \的类别，N表示训练样本的总个数，D表示训练样本的维数，且预先设定降维后的维数r ; 贝1J，所述依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理，包括：
[0011] 令所述训练样本的初始维数d = D，以F= {1，...，D}为特征索引集合，以所述原始训练样本集h，.VAl1的子集
【主权项】
1. 一种医疗诊断模型的建立方法，其特征在于，包括：依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理；依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练，生成医疗诊断模型。
2. 根据权利要求1所述的方法，其特征在于，所述原始训练样本集由丨I1表征，其中Xie RD，yie {+1，-1}，y i表示X撕类别，N表示训练样本的总个数，D表示训练样本的维数，且预先设定降维后的维数r ;则，所述依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理，包括：令所述训练样本的初始维数d = D，以F = {1，...，D}为特征索引集合，以所述原始训练样本集的子集为特征选择训练集合，求解所述SVDD的优化问题
min Λ 得到Qi, i = 1，...，η，其中，f中的特征由所述 s.t. ^ = I, O < a. < C i=l , 特征索引集合F确定且为同一类别的训练样本，η为+1类样本的个数，api = l，...，n是 Lagrange乘子，C为预先设定的惩罚因子且C>0 ; η _ \ ' tyfj 依据所述α i，i = 1，. . .，n计算中心向量w : W = 其中w = [W1, W2，…，wd] T e Rd；依据所述中心向量w查找被剔除的第j个特征^ = W . ? 令所述训练样本的低维维数d' = d-Ι，依据所述第j个特征更新所述特征索引集合F = F\j和所述特征选择训练集合|^~，乃=+l|(=i其中，中的特征是由索引集合F来确定的；判断所述d'是否等于预先设定的降维后的维数r，若不等于，则令d = d'，并重复上述步骤。
3. 根据权利要求2所述的方法，其特征在于，还包括：若所述d'等于预先设定的降维后的维数r，则结束循环，经过降维处理后得到的低维训练样本组成的低维训练样本集由表征，其中
4. 根据权利要求3所述的方法，其特征在于，所述依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练，生成医疗诊断模型，包括：依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集卜，:)^Λ进行训练，生成医疗诊断模型I(xZ) = sgn(其尾xZ+的，其中，Χ? β龙b是由支持向量机训练算法训练产生的模型系数，sgn〇表示符号函数。
5. 根据权利要求1所述的方法，其特征在于，还包括：通过所述SVDD算法进行特征选择，对接收到的测试样本集中的各个测试样本进行降维处理，并将经过降维处理后得到的低维测试样本组成的实测样本集输入所述医疗诊断模型中，对所述实测样本集进行预测，将预测结果作为对所述测试样本集的诊断结果。
6. -种医疗诊断模型的建立装置，其特征在于，包括：特征选择模块，用于依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理；模型建立模块，用于依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练，生成医疗诊断模型。
7. 根据权利要求6所述的装置，其特征在于，所述原始训练样本集由表征，其中Xie R D，yie {+1，-1}，y i表示X 类别，N表示训练样本的总个数，D表示训练样本的维数，且预先设定降维后的维数r ;则，所述特征选择模块，具体用于：令所述训练样本的初始维数d = D，以F = {1，...，D}为特征索引集合，以所述原始训练样本集丨XphKI1的子集=+1^为特征选择训练集合，求解所述SVDD的优化问题 min ΣΣ^? (^)-Ρ^? (<) __ η'1 ' j 得到α i，i = 1，. . .，η，其中，χ;"'"中的特征由所述 s.t. 0 < < C 7 i=l 特征索引集合F确定且为同一类别的训练样本，n为+1类样本的个数，dpi = l，...，n是 Lagrange乘子，C为预先设定的惩罚因子且C>0 ; η _ ^ twi 依据所述α i，i = 1，. . .，n计算中心向量w : w = 其中w = [W1, W2，…，wd] ?=Ι , Te Rd；依据所述中心向量w查找被剔除的第j个特征/ = SitV1I 令所述训练样本的低维维数d' = d-Ι，依据所述第j个特征更新所述特征索引集合F = F\j和所述特征选择训练集合<[〇=+￡%其中，^中的特征是由索引集合F来确定的；判断所述d'是否等于预先设定的降维后的维数r，若不等于，则令d = d'，并重复上述步骤。
8. 根据权利要求7所述的装置，其特征在于，所述特征选择模块，还用于：若所述d'等于预先设定的降维后的维数r，则结束循环，经过降维处理后得到的低维训练样本组成的低维训练样本集由乃}=表征，其中f e iT。
9. 根据权利要求8所述的装置，其特征在于，所述模型建立模块，具体用于：依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集{^ν,}Λ进行训练，生成医疗诊断模型.,(xZ) =sgn(Z (x,.) xZ+Z))，其中，万e iT， β龙b是由支持向量机训练算法训练产生的模型系数，sgnO表示符号函数。
10.根据权利要求6所述的装置，其特征在于，还包括：医疗诊断模块，用于通过所述SVDD算法进行特征选择，对接收到的测试样本集中的各个测试样本进行降维处理，并将经过降维处理后得到的低维测试样本组成的实测样本集输入所述医疗诊断模型中，对所述实测样本集进行预测，将预测结果作为对所述测试样本集的诊断结果。
【专利摘要】本申请提供一种医疗诊断模型的建立方法及装置，该方法首先依据支持向量数据描述SVDD算法进行特征选择，对预存储的原始训练样本集中的各个训练样本进行降维处理，然后依据支持向量机训练算法对经过降维处理后得到的低维训练样本组成的低维训练样本集进行训练，生成医疗诊断模型。这种医疗模型的建立方法在迭代过程中通过SVDD算法的特征选择，根据给定的排序准则删除若干个不重要特征，可以降低建模过程的时间复杂性，实现对医疗数据的快捷处理，提高诊断能力。
【IPC分类】G06F19-00
【公开号】CN104657574
【申请号】CN201410262085
【发明人】张莉, 曹晋, 鲁亚平, 王邦军, 何书萍, 李凡长, 杨季文
【申请人】苏州大学
【公开日】2015年5月27日
【申请日】2014年6月13日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张莉;曹晋;鲁亚平;王邦军;何书萍;李凡长;杨季文;
技术所有人：苏州大学;
我是此专利的发明人

上一篇：基于光线传感器的光源和环境分析方法
上一篇：用于三维空间的泄漏气体扩散预测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。