基于PCNN网络和注意力机制的中医辨证辅助决策方法与流程

文档序号:18635038发布日期:2019-09-11 22:08阅读:409来源:国知局
基于PCNN网络和注意力机制的中医辨证辅助决策方法与流程
本发明涉及一种中医辨证辅助决策方法,具体地说,涉及一种基于pcnn网络和注意力机制的中医辨证辅助决策方法。
背景技术
:“辨证论治”是传统中医的主要特点,即将望、闻、问、切(四诊)收集的症状,依四诊合参原则,加以分析和总结,确定疾病的病理、病性、病位和邪正关系,从而确定疾病的证侯,并选择相应的治疗。中医辨证是中医诊断疾病的理论核心,也是中医诊断学的难题。传统中医辨证过程中,医生通过感官观察和患者的主观描述获取患者的症状和体征信息,医生根据个人知识和经验对患者信息进行整合,并得出诊断结果,辨证的准确性在一定程度上取决于医生的个人经验、诊断技巧、认识水平和思维能力,主观性较强,其辨证过程更是一个“黑箱理论”,难以诠释。为了解决这些问题,出现了一大批基于数据挖掘技术的辨证辅助决策方法,其中最新研究lda模型分析关于糖尿病的临床病例,以此来发现隐藏在症状和证候之间的关联知识,结果发现了关于糖尿病辨证的7种不同的证侯,每种证侯包含不同的症状。目前基于数据挖掘技术的辨证辅助决策方法只适用于单一的特定疾病,如果进行其它疾病的辨证结果预测时,辨证准确率相对于特定疾病会大幅度下降,如使用aprior算法从丁氏外科临床医案数据中挖掘辨证规律,所得结果只适用于丁氏外科的疾病辨证,缺乏扩展性;其次,在根据医案数据进行辨证规律研究时,仅从症状方面入手,而忽略了病位和病机对辨证结果的影响,导致辨证结果与真实结果相差甚大。技术实现要素:有鉴于此,本发明针对现有辨证决策方法存在的扩展性差、只考虑单一影响因素的问题,提供了一种基于pcnn网络和注意力机制的中医辨证辅助决策方法,结合影响辨证的症状、病因、病机等3种特征,基于点排序cnn网络(pcnn)自动提取医案特征,进行辨证结果预测;同时考虑不同医案对辨证结果的影响权重不同,进一步采用注意力(att)机制对所有医案进行权重分配,优化预测模型。为了解决上述技术问题,本发明公开了一种基于点排序cnn网络和注意力机制的中医辨证辅助决策方法,具体包括:步骤1,预处理:使用语言技术平台(ltp)工具对每份医案进行分词处理;步骤2,医案编码:使用点排序cnn网络(pcnn)对每份医案进行特征编码,构建其对应的特征向量表示;步骤3,使用注意力attention机制进行证候预测。进一步地,步骤2具体为:首先将每个医案转换为特征向量表示,然后利用卷积、分段式最大池化和非线性转换构建对应的医案特征向量。进一步地,将每个医案转化特征向量表示,具体步骤如下:医案子集m1提取:根据完全词匹配法在原始医案集中搜索包含症状集s的医案,形成医案子集m1={m1,…,ml,…,md};对医案子集m1中的医案ml={w1,w2,…,wm},(1≤l≤d)进行向量化表示,其中,wi表示医案经过预处理之后包含于其中的症状、病因、病机特征;单词wi(1≤i≤m)的向量表示单词编码+位置编码,其中单词编码:用word2vec将词wi转换为向量形式;位置编码:根据词wi与首实体w1和尾实体wm的距离构建二维向量;医案ml的向量化表示如下:其中,m为医案ml中出现的不重复特征数,即症状、病因、病机特征。进一步地,卷积:使用卷积操作对医案进行局部特征提取,具体为:卷积核的选取:选择3个卷积核wi(1≤i≤3),随机初始化卷积核wi的值,根据分类结果动态调整卷积核的值,选取最优的症状特征、病位特征、病性特征;滑动长度:l=3,步长:stride=1;滑动窗口设为q,如下所示:q={wi-l+1,wi-l+2,…,wi}(2)卷积操作:其中,pi为使用卷积核wi提取到的局部特征,为偏置向量。进一步地,分段式最大池化:联合由3个卷积核所提取到局部特征,得到一个固定长度的向量,该向量由q+1部分组成,对每部分进行最大池化,如下所示:[x]ij=max(pij)(4)其中,[x]ij表示由第i个卷积核提取到的第j个关键特征。进一步地,非线性转换构建对应的医案特征向量:其中,表示由3个卷积核wi(1≤i≤3)所提取的医案的关键特征表示。进一步地,步骤3使用注意力attention机制进行证候预测,具体为:权重分配:对医案子集m1中的所有医案分配不同的权重,给包含该症状集的所有医案分配权重:其中,αl表示医案的权重分配,el表示医案对于证候的匹配程度,如下所示:为了表示每份医案在进行辨证规律挖掘时的影响效果,使用权重对医案子集m1进行再表示,如下所示:为了使得网络的输出数目与证候标签数相同,以便softmax层进行分类,故使用式(9)对其进行维度处理:其中,a是所有证候向量组成的矩阵,为偏置向量;使用softmax函数预测医案在证候r上的概率,如下所示:其中,k为医案集中出现的所有证候数,p表示医案在k个证候上的向量表示。与现有技术相比,本发明可以获得包括以下技术效果:1)本发明使用点排序cnn网络(pcnn)自动提取医案的症状、病因、病机等特征,构建对应的特征编码,不需人工标注特征;2)本发明引入注意力(att)机制消除噪音语料,对医案分配不同权重,提高分类精度;3)本发明从医案数据的症状、病因、病机等多个方面出发进行辨证规律挖掘,提高了辨证结果的可靠性;同时,本发明适用于大多数疾病的辨证规律发现,其具有很高的可扩展性。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是本发明实施例中辨证整体流程图;图2是本发明实施例中使用pcnn网络进行医案编码的原理示意图。具体实施方式以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。本发明以医案数据为基础进行辨证规律研究,首先从症状、病因、病机3个特征入手,使用点排序cnn网络(pcnn)把原始医案转换成由这些特征构成的向量形式;然后,使用注意力机制(att)给所有医案进行权重分配;最后,使用softmax函数对医案进行证候分型,辨证整体流程如图1所示。数据集:医案集m,以医案集中出现的所有证候为标签,假设证候数为k。m={m1,m2,m3,…,mn}输入:慢性肾病症状集s={s1,s2,…,sv};输出:k维向量,每个维度表示相应证候标签的概率。本发明公开了一种基于点排序cnn网络和注意力机制的中医辨证辅助决策方法,具体包括:步骤1,预处理:使用语言技术平台(ltp)工具对每份医案进行分词处理;结果如下所示:腿痛、目晕、口干、腰酸、大便稀、夜尿多、肝、肾、肝肾两虚等。步骤2,医案编码:使用点排序cnn网络(pcnn)对每份医案进行特征编码,构建其对应的特征向量表示。首先将每个医案转换为特征向量表示,然后利用卷积、分段式最大池化和非线性转换构建对应的医案特征向量,原理示意图如图2所示。将每个医案转化特征向量表示,具体步骤如下:1)医案子集m1提取:根据完全词匹配法在原始医案集中搜索包含症状集s的医案,形成医案子集m1={m1,…,ml,…,md};对医案子集m1中的医案ml={w1,w2,…,wm},(1≤l≤d)进行向量化表示,其中,wi表示医案经过预处理之后包含于其中的症状、病因、病机特征;单词wi(1≤i≤m)的向量表示单词编码+位置编码,其中单词编码:用word2vec将词wi转换为向量形式;位置编码:根据词wi与首实体w1和尾实体wm的距离构建二维向量;医案ml的向量化表示如下:其中,m为医案ml中出现的不重复特征数,即症状、病因、病机特征。2)卷积:使用卷积操作对医案进行局部特征提取,具体为:卷积核的选取:选择3个卷积核wi(1≤i≤3),随机初始化卷积核wi的值,根据分类结果动态调整卷积核的值,选取最优的症状特征、病位特征、病性特征;滑动长度:l=3,步长:stride=1;滑动窗口设为q,如下所示:q={wi-l+1,wi-l+2,…,wi}(2)卷积操作:其中,pi为使用卷积核wi提取到的局部特征,为偏置向量。3)分段式最大池化:联合由3个卷积核所提取到局部特征,得到一个固定长度的向量,该向量由q+1部分组成,对每部分进行最大池化,如下所示:[x]ij=max(pij)(4)其中,[x]ij表示由第i个卷积核提取到的第j个关键特征,如医案中的主症表示。4)非线性转换构建对应的医案特征向量:其中,表示由3个卷积核wi(1≤i≤3)所提取的医案的关键特征表示,如主症、主要病因、主要病机等。步骤3,使用注意力attention机制进行证候预测。具体为:1)权重分配:对医案子集m1中的所有医案分配不同的权重,给包含该症状集的所有医案分配权重:其中,αl表示医案的权重分配,el表示医案对于证候的匹配程度,如下所示:2)为了表示每份医案在进行辨证规律挖掘时的影响效果,使用权重对医案子集m1进行再表示,如下所示:3)为了使得网络的输出数目与证候标签数相同,以便softmax层进行分类,故使用式(9)对其进行维度处理:其中,a是所有证候向量组成的矩阵,为偏置向量;4)使用softmax函数预测医案在证候r上的概率,如下所示:其中,k为医案集中出现的所有证候数,p表示医案在k个证候上的向量表示。本发明使用点排序cnn网络(pcnn)自动提取医案的症状、病因、病机等特征,构建对应的特征编码,不需人工标注特征。本发明引入注意力(att)机制消除噪音语料,对医案分配不同权重,提高分类精度。与最新的研究方法相比,本发明从医案数据的症状、病因、病机等多个方面出发进行辨证规律挖掘,提高了辨证结果的可靠性;同时,该发明适用于大多数疾病的辨证规律发现,其具有很高的可扩展性。表1辨证结果症状群证候呼吸急促、胸闷气慌、咳嗽、多汗肺肾气虚证心痛憋闷、心悸盗汗、头晕耳鸣、口干、便秘心肾阴虚证神疲乏力、多卧嗜睡、健忘、畏寒肢冷脾肾阳虚证急躁易怒、善忘、面红耳赤、口干、舌燥心肝火旺证……表1为采用本发明方法预测的证候,邀请了电子科技大学校医院的中医医师分析了表1的辨证结果,结果发现每个证候下92.17%症状可以用《中医内科学》来验证。上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1