疾病特征智能匹配方法_2

文档序号:9200575阅读:来源:国知局
5条高血压患者 住院记录,选取出院小结表中患者的基本信息,以及相应的诊断体征数据3和住院期间的 检验检查数据4。
[0048] 步骤2、根据《中国高血压防治指南(2010年版)》构建高血压疾病体征词袋,将电 子病历中的非结构化体征信息进行结构化处理5,得到高血压患者体征指标集,即乏力、腹 痛腹胀、恶心呕吐、咳嗽、气促、心悸、干湿罗音、发烧、胸痛胸闷、头昏头痛、尿频尿急、盗汗、 口干、视力模糊、大便秘结、腰酸腰痛、呼吸音低粗、四肢麻木、睡眠质量差、咳痰、颈部肿块、 耳鸣、精神萎靡、意识模糊、口齿含糊、压痛、背部酸痛、舌淡、抽搐、吞咽困难共计30项。
[0049] 依据高血压体征指标集重构高血压体征数据,即按照卡号和卡类型将诊断体征信 息构造成一个0-1矩阵,称之为患者体征指标特征矩阵6,它是一个非对称的稀疏矩阵,其 中0表示患者不存在相应的体征特征,1表示存在。
[0050] 步骤3、结合《中国高血压防治指南(2010年版)》中的常规检验检查项目,将检验 检查表按照卡号、卡类型整理成患者检验检查指标特征矩阵7,它也是一个非对称的稀疏矩 阵,每行表示一位患者的检验检查指标向量,分量值为相应的检验检查结果。在实施中,选 择的指标为谷草转氨酶(AST)、谷丙转氨酶(ALT)、尿素氮(BUN)、24小时尿钾、24小时尿钠、 B型钠尿肽(BNP)、C反应蛋白(CRP)、口服葡萄糖胰岛素释放实验(空腹0GTT、1小时0GTT、 2小时0GTT)、低密度蛋白胆固醇(LDL)、尿酸、尿蛋白肌酐、尿蛋白、尿PH值、尿红细胞。
[0051] 步骤4、按照卡号、卡类型整合患者体征指标特征矩阵6和患者检验检查指标特征 矩阵7,构成高血压病例特征矩阵8。并在此基础上建立疾病特征的智能匹配方案,用于辅 助诊断。
[0052] 步骤5、消除稀疏性造成的匹配率下降的问题。将高血压病例特征矩阵8按照特征 进行标准化10,基于此,采用分块主成分分析11执行维数约简9,合并得到约简后的病例特 征矩阵13。同时将待匹配患者的特征向量14投影至相同的空间,得到约简后的带匹配患者 的特征向量。在本实施样例中,随机选取80%的病例特征数据用于训练规则,其余20 %用 于规则的性能评估。经稀疏度计算12,训练数据的稀疏度达到了 82. 94%,对其执行分块主 成分分析11,合并构成表1的约简矩阵,其中,前30行为体征指标,后16项为检验检查指 标。
[0053] 表1病例特征矩阵的约简矩阵
[0054]
[0055] 步骤6、针对第5步获取的约简后的病例特征矩阵13,采用基于相似度的近邻规 贝1J,获取待匹配患者14的最近邻特征矩阵。采用余弦相似性16的前提下,提取患者的20 项最近邻特征构成患者的近邻特征集17,并记录相应的相似度用于后续计算。为了详细阐 明,这里选取其中五位患者作为样例说明。若选择的患者体征指标为:
[0056] patientl : (1,1,0,0,0,0,1,0,0,1,1,1,1,0,1,1,1,1,0,0,1,0,0,1,0,0,0,0,0, 〇)
[0057] patient2 : (0,1,0,0,0,1,1,0,1,0,0,0,0,0,0,0,1,0,0,0, 〇)
[0058] patient3 : (0,1,0,0,0,1,1,1,1,0,0,1,1,0,0,0,1,0,0,0, 〇)
[0059] patient4 : (0,1,0,0,0,0,1,0,0,0,1,0,0,0,0,0,1,1,0,0,0,0,0,0,0,1,0,0,0, 〇)
[0060] patient5 : (0,1,0,1,0,0,1,0,0,0,0,0,0,0,1,0,1,0,0,1,0,1,0,0,0,1,0,0,0, 〇)
[0061] 这里仅给出了体征指标,没有显式列出检验检查指标。表2给出了 5位患者的近 邻特征在匹配库中的位置和相应的相似度。可以看出,在选择20-近邻的前提下,近邻规则 的质量很高,相似度都在99%以上。
[0062] 表2与待匹配患者最近邻特征所在行数和相应的相似度
[0063]
[0064] 这里,灰色底纹所示数字为近邻特征在病例特征矩阵中的行数,下方对应的是相 似度。
[0065] 7、计算待匹配患者各项指标的得分19。表3给出了 5位患者特征的得分(归一化 后的得分)和相应的排名。
[0066] 表3患者指标得分和排名结果表
[0067]
[0068]

[0069] 根据表3可知,在匹配特征得分贡献度大于95%的原则下,提取5位患者按得分从 大到小排序后的特征见表4。可以看出,特征匹配不仅涵盖了 5位患者的绝大多数实际体 征,而且给出了实际体征的排名。参考疾病特征匹配结果,医生可快速精准的诊断疾病。
[0070] 表4 95%原则下匹配特征和相应的覆盖率
[0071]
[0072]
[0073] 可以看出patient5的体征"咳痰"未被匹配到,为了分析整个系统的优劣,采用经 验累积概率分布函数(CDF) 21来衡量。由图2可知,覆盖率小于0. 9的CDF仍然小于0. 3, 也就是说70%的覆盖率超过了 0. 9。在覆盖率小于0. 7被认为匹配不合格的原则下,⑶F大 约在0. 05,也就是说95%的匹配都是合格的。说明疾病特征智能匹配和预测模型具备优秀 的匹配体征覆盖率,可以辅助医生诊断患者体征,防止漏诊。
【主权项】
1. 一种疾病特征智能匹配方法,其特征在于,包括以下步骤: 步骤1、对电子病例库中已有的患者数据按照事先建立的疾病体征集和检验检查指标 集提取相应的值构成每位患者的特征向量,将所有患者的特征向量整合成病例特征矩阵 D; 步骤2、采用主成分分析提取病例特征矩阵D的主成分,并按照主成分所在方向进行数 据变换,变换后的空间称为病例特征矩阵D的特征空间F; 步骤3、将待匹配患者的疾病体征数据和检验检查数据投影到特征空间F中,并计算待 匹配患者与病例特征矩阵D中每一位患者的特征向量的相似度,排序选择相似度最大的前 N个患者的特征向量作为待匹配患者的最近邻特征集U: 步骤4、以相似度为权值,计算待匹配患者的各疾病体征指标和检验检查指标的得分, 选取排序后得分贡献度在一定百分比以上的疾病体征指标和/或检验检查指标作为判断 病症的主要特征,用于辅助诊断,其中,第i个待匹配患者的第a个指标的得分为Pia,则有:,式中,为第i个待匹配患者的指标的平均值,^1^_为 第i个待匹配患者与最近邻特征集U中第j个患者的相似度,zja表示最近邻特征集U中第j个患者的第a个指标的得分,^为最近邻特征集U中第j个患者的指标的平均值。2. 如权利要求1所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤1中,所 述疾病体征集和检验检查指标集通过以下方法得到: 以包含患者基本信息、体征信息、检验检查信息和诊断信息的电子病历为基础,结合疾 病防治指南和国内外研宄现状构建的疾病体征词袋,将电子病历中的非结构化体征信息进 行结构化处理,得到疾病体征集和检验检查指标集。3. 如权利要求1所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤3中, 采用余弦相似性度量计算待匹配患者与病例特征矩阵D中每一位患者的特征向量的相 似度,则在所述步骤4中,第i个待匹配患者与最近邻特征集U中第j个患者的相似度,式中,fi为第i个待匹配患者的特征向量,f」为最近邻特征集U中第j个 患者的特征向量。4. 如权利要求1所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤4后还包 括: 步骤5、采用数据稀疏性评估和匹配模型评估进行性能评估。5. 如权利要求1所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤2之前并 所述步骤1之后还包括: 步骤A、将所述病例特征矩阵D分块,即分为患者疾病体征指标矩阵X和患者检验检查 指标矩阵Y,则所述步骤2为: 分别对患者疾病体征指标矩阵X和患者检验检查指标矩阵Y执行主成分分析,并按照 主成分所在方向进行数据变换,将分别变换后获得的特征空间串型组合成病例特征矩阵D 的特征空间F。6. 如权利要求5所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤2之前并 所述步骤A之后还包括: 步骤B、将所述病例特征矩阵D中的数据进行标准化,以消除量纲和数量级的影响。7. 如权利要求6所述的一种疾病特征智能匹配方法,其特征在于,采用相同的方法分 别将所述患者疾病体征指标矩阵X和患者检验检查指标矩阵Y中的数据标准化,其中,设患 者疾病体征指标矩阵X有n行m列,则将患者疾病体征指标矩阵X中的体征指标值标准 化为%的方法为:式中,h为第j项体征指标的均值,为第j项体征指标的方差,8. 如权利要求1所述的一种疾病特征智能匹配方法,其特征在于,在所述步骤2中,选 取主成分时选择累积方差贡献度大于0. 85的成分作为主成分,且主成分相应的特征值必 须大于1,以保证所选主成分足以解释原变量。
【专利摘要】本发明提供了一种疾病特征智能匹配方法。本发明利用患者的体征和检验检查数据来构建疾病特征的智能匹配模型,用于辅助诊断和治疗方案推荐。本发明的有益效果是,与传统的基于关键词搜索的方法不同,本发明所涉及的疾病特征的智能匹配方法和系统,能根据患者体征和检验检查指标信息诊断病情,同时获取相应治疗方案推荐,为医生的诊治提供参考,同时提高诊治的效率。
【IPC分类】G06F19/00
【公开号】CN104915561
【申请号】CN201510319351
【发明人】张敬谊, 何萍, 张鑫金, 杨冬艳, 李光亚, 陈诚
【申请人】万达信息股份有限公司, 上海卫生信息工程技术研究中心有限公司
【公开日】2015年9月16日
【申请日】2015年6月11日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1